Шта је Цхи-Скуаре статистика?
Цхи-квадрат ( χ 2) статистика је тест који мери како се очекивања упоређују са стварним посматраним подацима (или резултатима модела). Подаци кориштени за израчунавање хи-квадрат статистике морају бити случајни, сирови, међусобно искључиви, изведени из независних варијабли и прикупљени из довољно великог узорка. На пример, резултати бацања новчића 100 пута испуњавају ове критеријуме.
Цхи-квадрат тестови се често користе у испитивању хипотеза.
Формула за Цхи-Скуаре Ис
χц2 = ∑ (Ои − Еи) 2Егде: ц = степени слободеО = посматрана вредност (е) Е = очекивана вредност (и) почетак {поравнање} & \ цхи ^ 2_ц = \ збир \ фрац {(О_и - Е_и) ^ 2} {Е_и} \ & \ тектбф {где:} \ & ц = \ текст {степени слободе} \ & О = \ текст {посматране вредности (вредности)} \ & Е = \ текст {очекиване вредности } \ \ крај {поравнано} χц2 = ∑Еи (Ои −Еи) 2 где је: ц = степен слободеО = посматрана вредност (и) Е = очекивана вредност (и)
Шта вам говори статистика Цхи-Скуареа?
Постоје две главне врсте хи-квадрат тестова: тест независности, који поставља питање односа, попут: "Постоји ли веза између пола и САТ резултата?"; и тест добре исправности, који поставља питање попут „Ако се новчић баци 100 пута, хоће ли се дигнути главе 50 пута, а репови 50 пута?“
За ове тестове користе се степени слободе да би се утврдило да ли се одређена нулта хипотеза може одбацити на основу укупног броја променљивих и узорака унутар експеримента.
На пример, када се узму у обзир студенти и избор предмета, вероватноћа узорка од 30 или 40 студената вероватно није довољно велика да би створила значајне податке. Добијање истих или сличних резултата студије коришћењем величине узорка од 400 или 500 студената је тачније.
У другом примеру, размислите о бацању новчића 100 пута. Очекивани резултат бацања правог новца 100 пута је да ће се главе дизати 50 пута, а репови ће се појавити 50 пута. Стварни резултат може бити да се главе дижу 45 пута, а репови 55 пута. Статистика хи-квадрата показује било какве разлике између очекиваних и стварних резултата.
Пример теста Цхи-Скуаред
Замислите да је извршена случајна анкета код 2.000 различитих гласача, и мушкараца и жена. Људи који су одговарали класификовани су по полу и по томе да ли су републикански, демократични или независни. Замислите мрежу са ступовима са натписом републиканска, демократска и независна, и два реда са натписом мушкарац и жена. Претпоставимо да су подаци од 2.000 испитаника следећи:
Први корак за израчунавање хи-квадрат статистике је проналазак очекиваних фреквенција. Они се израчунавају за сваку "ћелију" у мрежи. Будући да постоје две категорије рода и три категорије политичког становишта, постоји шест укупно очекиваних учесталости. Формула за очекивану фреквенцију је:
Е (р, ц) = н (р) × ц (р) нигде: р = ред у питањец = ступац у питањун = одговарајући укупни \ почетак {поравнање} & Е (р, ц) = \ фрац {н (р) пута ц (р)} {н} \ & \ тектбф {где:} \ & р = \ текст {ред у питању} \ & ц = \ текст {колона у питању} \ & н = \ текст {одговарајући укупно} \ \ крај {усклађено} Е (р, ц) = нн (р) × ц (р) где је: р = ред у питањец = ступац у питањун = одговарајући укупан број
У овом примјеру, очекиване фреквенције су:
- Е (1, 1) = (900 к 800) / 2, 000 = 360Е (1, 2) = (900 к 800) / 2, 000 = 360Е (1, 3) = (200 к 800) / 2 000 = 80Е (2, 1) = (900 к 1.200) / 2.000 = 540Е (2, 2) = (900 к 1.200) / 2.000 = 540Е (2, 3) = (200 к 1.200) / 2.000 = 120
Даље, ове се вредности користе за израчунавање хи-квадрат статистике користећи следећу формулу:
Цхи-квадрат = ∑2Е (р, ц) где је: О (р, ц) = посматрани подаци за одређени ред и ступац \ почетак {поравнање} & \ тект {Цхи-квадрат} = \ сум \ фрац {^ 2} {Е (р, ц)} \ & \ тектбф {где:} \ & О (р, ц) = \ текст {посматрани подаци за дати ред и ступац} \ \ крај {поравнање} Цхи-квадрат = ∑Е (р, ц) 2 где је: О (р, ц) = посматрани подаци за дати ред и ступац
У овом примјеру, израз за сваку посматрану вриједност је:
- О (1, 1) = (400 - 360) 2/360 = 4, 40 О (1, 2) = (300 - 360) 2/360 = 10О (1, 3) = (100 - 80) 2/80 = 5О (2, 1) = (500 - 540) 2/540 = 2, 96 О (2, 2) = (600 - 540) 2/540 = 6, 67 О (2, 3) = (100 - 120) 2/120 = 3, 33
Статистика хи-квадрата тада је једнака збиру ове вредности, или 32, 41. Затим можемо погледати табеларну табелу са квадратном квадратом да бисмо видели, имајући у виду степене слободе у нашој постави, да ли је резултат статистички значајан или не.
