Шта је Хомоскедастиц?
Хомоскедастички (такође написан „хомосцедастички“) односи се на стање у коме је варијанца заосталог или грешног термина у регресијском моделу константна. Односно, израз грешке не варира много као што се мења вредност променљиве предвиђања. Међутим, недостатак хомоскедастичности може сугерисати да ће регресијски модел можда морати да садржи додатне променљиве предвиђања да би се објаснио учинак зависне променљиве.
Кључне Такеаваис
- Хомоскедастичност се јавља када је варијанца термина грешке у регресијском моделу константна. Ако је варијанца термина грешке хомоскедастична, модел је био добро дефинисан. Ако постоји превелика разлика, модел можда није добро дефинисан. Додавање додатних променљивих предвиђања може помоћи у објашњавању перформанси зависне променљиве. Супротно томе, хетероскедастичност се јавља када варијанца термина грешке није константна.
Како функционира Хомоскедастика
Хомоскедастичност је једна претпоставка моделирања линеарне регресије. Ако варијанца грешака око регресијске линије знатно варира, регресијски модел може бити лоше дефинисан. Супротност хомоскедастичности је хетероскедастичност исто као што је супротност „хомогености“ „хетерогена“. Хетероскедастичност (такође написана „хетеросцедастичност“) односи се на стање у којем варијанца термина грешке у регресијској једначини није константна.
Када се узме у обзир да је варијанца измерена разлика између предвиђеног исхода и стварног исхода дате ситуације, одређивање хомоскедастичности може помоћи да се утврди који фактори се морају прилагодити за тачност.
Посебна разматрања
Једноставни регресијски модел, или једначина, састоји се од четири појма. На левој страни је зависна променљива. Представља феномен који модел настоји да "објасни". На десној страни су константа, променљива предиктора и резидуални или грешка. Израз грешке показује количину варијабилности у зависној варијабли која није објасњена променљивом предвиђачем.
Пример Хомоскедастичког
На пример, претпоставимо да сте желели да објасните оцене студентских тестова користећи количину времена које је сваки студент провео студирајући. У овом случају, резултати тестова били би зависна варијабла, а време проведено у проучавању било би променљиво предвиђање.
Израз грешке показао би количину варијанце у резултатима теста која није објасњена временом проучавања. Ако је та варијанца једнообразна или хомоскедастичка, онда би то сугерирало да модел може бити адекватно објашњење перформанси теста - објашњавајући га у смислу времена проведеног у студирању.
Али варијанта може бити хетероскедастична. Нацрт података о терминима грешке може показати да је велика количина времена испитивања врло одговарала високим резултатима испитивања, али да су резултати теста са малим временом испитивања варирали и укључивали су неке врло високе резултате. Дакле, варијансу бодова не би добро објаснила само једна варијабла предиктора - количина времена проучавања. У овом случају, неки други фактор је вероватно на делу, а модел ће можда требати побољшати како би се идентификовали или они. Даљња истрага може открити да су неки студенти одговор на тест видели пре времена или да су претходно прошли сличан тест, па им није било потребно да проучавају овај одређени тест.
Да би се побољшао регресијски модел, истраживач би, стога, додао још једну променљиву објашњење која би указивала да ли је ученик видео одговоре пре теста. Регресијски модел би тада имао две објашњавајуће променљиве - време проучавања и да ли је ученик претходно знао одговоре. Са ове две променљиве објаснила би се више варијанца тестова и варијанта термина грешке могла би бити хомоскедастична, што сугерира да је модел добро дефинисан.
