Шта је вишеструка линеарна регресија - МЛР?
Вишеструка линеарна регресија (МЛР), такође позната и као вишеструка регресија, је статистичка техника која користи неколико објашњивих променљивих за предвиђање исхода променљиве одговора. Циљ вишеструке линеарне регресије (МЛР) је моделирање линеарног односа између експланаторних (независних) променљивих и варијабле одговора (зависних).
У суштини, вишеструка регресија је проширење обичне регресије најмањег квадрата (ОЛС) која укључује више од једне објашњавајуће променљиве.
Формула за вишеструку линеарну регресију је
Сігналы абмеркавання Ии = β0 + β1 ки1 + β2 ки2 +… + βп кип + ϵгде, за и = н запажања: ии = зависна променљиваки = експанзијске променљивеβ0 = и-пресретање (константа израз) βп = коефицијенти нагиба за сваку објашњиву променљивуϵ = израз грешке модела (такође познат као заостаци)
Објашњење вишеструке линеарне регресије
Једноставна линеарна регресија је функција која омогућава аналитичару или статистичару да предвиди једну променљиву на основу информација које су познате о другој променљивој. Линеарна регресија се може користити само када једна има две континуиране променљиве - независну и зависну променљиву. Независна варијабла је параметар који се користи за израчунавање зависне променљиве или исхода. Модел вишеструке регресије протеже се на неколико објашњивих варијабли.
Модел вишеструке регресије заснован је на следећим претпоставкама:
- Постоји линеарни однос између зависних варијабли и независних променљивих. Независне променљиве нису превише корелиране једна са другом. Моја запажања бирају се независно и насумично из популације. Остали се обично дистрибуирају са средњим вредностима 0 и варијанцом σ.
Коефицијент одређивања (Р-квадрат) је статистичка метрика која се користи за мерење колике варијације у исходу може да се објасни варијацијом независних променљивих. Р2 се увек повећава јер се у МЛР модел додаје више предиктора, иако предиктори можда нису повезани са променљивом исходом.
Сам Р2 се на тај начин не може користити за идентификацију који предиктори треба да буду укључени у модел, а који треба да буду искључени. Р2 може бити између 0 и 1, при чему 0 означава да исход није могуће предвидјети ниједном независном променљивом, а 1 означава да се исход може предвидјети без грешке независних променљивих.
Када се интерпретирају резултати вишеструке регресије, бета коефицијенти су валидни, а све остале променљиве одржавају константним („све остале једнаке“). Излаз из вишеструке регресије може се приказати водоравно као једначина, или вертикално у облику табеле.
Пример употребе вишеструке линеарне регресије
На пример, аналитичар можда жели да зна како кретање тржишта утиче на цену Еккон Мобил-а (КСОМ). У овом случају ће његова линеарна једначина имати вредност С&П 500 индекса као независне променљиве, или предиктора, и цену КСОМ као зависне променљиве.
У стварности, постоји више фактора који предвиђају исход неког догађаја. Кретање цена Еккон Мобил-а, на пример, зависи од више него само од перформанси на укупном тржишту. Остали предиктори попут цена нафте, каматних стопа и кретања цена нафтних фјучерса могу утицати на цену КСОМ-а и цене акција других нафтних компанија. Да бисмо разумели однос у коме су присутне више од две променљиве, користи се вишеструка линеарна регресија.
Вишеструка линеарна регресија (МЛР) користи се за одређивање математичког односа међу бројем случајних варијабли. Другим речима, МЛР испитује повезаност више независних променљивих са једном зависном променљивом. Једном када је утврђено да је сваки од независних фактора предвидио зависну варијаблу, информације о више варијабли могу се користити за креирање тачних предвиђања о нивоу утицаја који имају на променљиву исходу. Модел ствара однос у облику равне линије (линеарне) која најбоље апроксимира све појединачне тачке података.
Позивајући се на МЛР једначину горе, у нашем примеру:
- и и = зависна варијабла: цена КСОМк и1 = каматне стопек и2 = цена нафтек и3 = вредност С&П 500 индекса к и4 = цена нафте у будућностиБ 0 = и-пресретање у времену нула 1 1 = коефицијент регресије који мери промену јединице у зависној променљива када се к и1 промени - промена цене КСОМ када се промене каматних стопаБ 2 = вредност коефицијента која мери јединицу промене зависне променљиве када се к и2 промени - промена цене КСОМ када се промене цене нафте
Процене најмање квадрата, Б 0, Б 1, Б 2 … Б п, обично се израчунавају статистичким софтвером. Што више варијабли може бити укључено у регресијски модел у коме је свака независна променљива диференцирана бројем - 1, 2, 3, 4… п. Модел вишеструке регресије омогућава аналитичару да предвиди исход на основу информација пружених на више објашњивих варијабли.
Ипак, модел није увек савршено тачан јер се свака тачка података може мало разликовати од резултата који је модел предвидио. Преостала вредност, Е, која је разлика између стварног исхода и предвиђеног исхода, укључена је у модел да би се објавиле тако мале разлике.
Под претпоставком да покрећемо наш КСОМ модел регресије цена путем софтвера за рачунање статистика, који враћа овај излаз:
Аналитичар би тај излаз протумачио ако би остале варијабле биле константне, цена КСОМ ће се повећати за 7, 8% ако се цена нафте на тржиштима повећа за 1%. Модел такође показује да ће цена КСОМ пасти за 1, 5% након раста каматних стопа за 1%. Р2 указује да се 86, 5% варијација цене акција Еккон Мобил-а може објаснити променама каматне стопе, цене нафте, будућности нафте и С&П 500 индекса.
Кључне Такеаваис
- Вишеструка линеарна регресија (МЛР), такође позната и као вишеструка регресија, је статистичка техника која користи неколико објашњивих променљивих за предвиђање исхода променљиве одзива. Вишеструка регресија је проширење линеарне (ОЛС) регресије која користи само једну променљиву промену. МЛР се широко користи у економетрији и финансијским закључцима.
Разлика између линеарне и вишеструке регресије
Линеарна (ОЛС) регресија упоређује одговор зависне променљиве с обзиром на промену неке објашњавајуће променљиве. Међутим, ретко је да се зависна варијабла објасни само једном променљивом. У овом случају, аналитичар користи вишеструку регресију, која покушава објаснити зависну варијаблу користећи више од једне независне променљиве. Вишеструка регресија може бити линеарна и нелинеарна.
Вишеструка регресија заснива се на претпоставци да постоји линеарни однос и између зависне и од независне променљиве. Такође не претпоставља велику корелацију између независних променљивих.
