Преглед садржаја
- Шта је Т-тест?
- Објашњење Т-теста
- Нејасни резултати испитивања
- Претпоставке Т-теста
- Прорачун Т-тестова
- Корелирани (или упарени) Т-тест
- Т-тест за једнаку варијансу (сакупљен)
- Т-тест неравномерне варијанце
- Одређивање Т-теста који треба користити
- Пример теста неједнаке варијанце
Шта је Т-тест?
Т-тест је врста инференцијалне статистике која се користи да се утврди да ли постоји значајна разлика између средстава две групе, која може бити повезана у одређеним карактеристикама. Најчешће се користи када ће скупови података, попут скупа података забиљежених као резултат пребацивања новчића 100 пута, слиједити нормалну дистрибуцију и можда ће имати непознате варијанце. Т-тест се користи као алат за тестирање хипотеза, који омогућава тестирање претпоставке примењиве на популацију.
Т-тестом се проматра т-статистика, вредности т-дистрибуције и степени слободе да би се утврдила вероватноћа разлике између два скупа података. За спровођење теста са три или више променљивих, треба користити анализу варијансе.
Т-тест
Објашњење Т-теста
У основи, т-тест нам омогућава да упоредимо просечне вредности два скупа података и утврдимо да ли потичу из исте популације. У горњим примерима, ако бисмо узели узорак ученика из разреда А и другог узорка ученика из Б разреда, не бисмо очекивали да ће имати потпуно исти просек и стандардну девијацију. Слично томе, узорци узети из контролне групе са храном плацебом и узорци узети из групе прописане лековима требало би да имају нешто другачију средњу вредност и стандардну девијацију.
Математички, т-тест узима узорак из сваке од две групе и успоставља исказ проблема претпостављајући нулту хипотезу да су два средства једнака. На основу примјењивих формула, одређене вриједности се израчунавају и успоређују са стандардним вриједностима, а претпостављена нулта хипотеза се прихвата или одбија у складу с тим.
Ако ниједна хипотеза испуњава услове за одбацивање, то указује да су читања података јака и нису случајна. Т-тест је само један од многих тестова који се користе у ту сврху. Статистичари морају додатно користити тестове који нису т-тест како би испитали више променљивих и тестове веће величине узорка. За велику величину узорка, статистичари користе з-тест. Остале опције тестирања укључују хи-квадрат тест и ф-тест.
Постоје три врсте т-тестова и они су категорисани као зависни и независни т-тестови.
Кључне Такеаваис
- Т-тест је врста инференцијалне статистике која се користи да се утврди да ли постоји значајна разлика између средстава две групе, која се могу повезати у одређеним карактеристикама. Т-тест је један од многих тестова који се користе у сврху испитивања хипотеза у статистици. Израчунавање т-теста захтева три кључне вредности података. Укључују разлику између средњих вредности из сваког скупа података (званих средња разлика), стандардног одступања сваке групе и броја података података сваке групе. Постоји неколико различитих врста т-теста који се могу извести у зависности о подацима и врсти потребне анализе.
Нејасни резултати испитивања
Узмите у обзир да произвођач лекова жели да тестира ново пронађени лек. Следи стандардни поступак покушаја лека на једној групи пацијената и давање плацеба другој групи, који се назива контролна група. Плацебо дат контролној групи је супстанца без предвиђене терапеутске вредности и служи као мерило за мерење начина на који друга група, на коју је дат стварни лек, реагује.
Након испитивања са лековима, чланови контролне групе са храном плацебом пријавили су повећање просечног животног века за три године, док чланови групе којој је прописан нови лек пријављују повећање просечног животног века за четири године. Тренутно посматрање може указивати на то да лек заиста делује јер су резултати бољи за групу која користи лек. Међутим, могуће је и да би посматрање могло настати услед случајне појаве, посебно изненађујуће среће. Т-тест је користан за закључак да ли су резултати тачни и применљиви на целу популацију.
У школи, 100 ученика у класи А је постигло просек од 85% са стандардним одступањем од 3%. Још 100 ученика који припадају класи Б постигло је просечно 87% са стандардним одступањем од 4%. Иако је просек разреда Б бољи од разреда А, можда није тачно претпоставити да је укупни учинак ученика у разреду Б бољи од успеха ученика у разреду А. То је зато што, заједно са значи, стандардно одступање класе Б такође је веће него код класе А. То указује да су њихови екстремни проценти на нижим и вишим странама много раширенији у поређењу са разредима А. Помоћу т-теста може се утврдити која класа је боље прошла.
Претпоставке Т-теста
- Прва претпоставка направљена у вези с т-тестовима односи се на мерну меру. Претпоставка за т-тест је да мерна скала примењена на прикупљене податке следи континуирану или ординалну скалу, као што су оцене за ИК тест. Друга претпоставка је да је реч о једноставном случајном узорку, да су подаци прикупљени од репрезентативног, насумично одабраног дела укупне популације. Трећа претпоставка су подаци, када се цртају, резултира нормалном расподјелом, користи се кривуља расподјеле у облику звона. Четврта претпоставка је релативно велика величина узорка. Већа величина узорка значи да би дистрибуција резултата требало да се приближи нормалној кривуљи у облику звона. Последња претпоставка је хомогеност варијанције. Хомогена или једнака варијанца постоји када су стандардна одступања узорака приближно једнака.
Прорачун Т-тестова
Израчунавање т-теста захтева три кључне вредности података. Они укључују разлику између средњих вредности из сваког скупа података (званих средња разлика), стандардног одступања сваке групе и броја вредности података сваке групе.
Резултат т-теста даје т-вредност. Ова израчуната т-вредност се затим упоређује са вредношћу добијеном из табеле критичних вредности (зване Т-табела расподјеле). Ово поређење помаже да се утврди колика је вероватноћа да се разлика између средстава догодила случајно или да ли скупови података заиста имају интринзичне разлике. Т-тест поставља питање да ли разлика између група представља истинску разлику у студији или је вјероватно бесмислена статистичка разлика.
Т-Дистрибутивни столови
Табела с расподјелом Т доступна је у форматима с једним репом и с два репа. Прва се користи за процену случајева који имају фиксну вредност или распон са јасним смером (позитиван или негативан). На пример, колика је вероватноћа да вредност излаза остане испод -3 или добије више од седам приликом котрљања пара коцкица? Потоња се користи за анализу ограниченог распона, попут постављања питања да ли координате падају између -2 и +2.
Прорачуни се могу извести са стандардним софтверским програмима који подржавају потребне статистичке функције, попут оних које се налазе у МС Екцел-у.
Т-вредности и степени слободе
Т-тест даје две вредности као свој излаз: т-вредност и степен слободе. Вредност т представља однос разлике између средње вредности два скупа узорака и разлике која постоји унутар скупа узорака. Иако је бројчана вредност (разлика између средње вредности два скупа узорака) једноставно израчунати, називник (разлика која постоји унутар скупа узорака) може постати мало компликован овисно о врсти вредности података. Назив односа је мерење дисперзије или променљивости. Веће вредности т-вредности, такође назване т-скор, указују на постојање велике разлике између два скупа узорака. Што је мања т-вредност, то је већа сличност између два скупа узорака.
- Велики т-скор указује на то да су групе различите. Мали т-скор указује да су групе сличне.
Степени слободе односе се на вредности студије која има слободу да варира и од суштинског је значаја за процену важности и ваљаности ништавне хипотезе. Израчунавање ових вредности обично зависи од броја записа података који су доступни у сету узорка.
Корелирани (или упарени) Т-тест
Корелирани т-тест се изводи када се узорци обично састоје од подударних парова сличних јединица или када постоје случајеви поновљених мјера. На пример, могу постојати случајеви да се исти пацијенти тестирају више пута - пре и после одређеног лечења. У таквим се случајевима сваки пацијент користи као контролни узорак против себе.
Ова метода се такође примењује у случајевима када су узорци на неки начин повезани или имају одговарајуће карактеристике, попут упоредне анализе која укључује децу, родитеље или браћу и сестре. Корелирани или упарени т-тестови су зависног типа, јер укључују случајеве када су два скупа узорака повезана.
Формула за израчунавање т-вредности и степена слободе за упарени т-тест је:
- Средња вредност1 и средња вредност2 су просечне вредности сваког узорка, док вар1 и вар2 представљају варијанцу сваког узорка.
Преостале две врсте припадају независним т-тестовима. Узорци ових врста су изабрани независно један од другог - то јест, скупови података у две групе не односе се на исте вредности. Они укључују случајеве попут групе од 100 пацијената који су подељени у две групе од по 50 пацијената. Једна од група постаје контролна група и њој се даје плацебо, док друга група прима прописани третман. Ово чини две независне групе узорака које нису међусобно париране.
Т-тест једнаке варијанце (или сакупљен)
Т-тест једнаке варијанце користи се када је број узорака у свакој групи исти или је варијанца двају скупа података слична. Следећа формула се користи за израчунавање т-вредности и степена слободе за т-тест једнаке варијанце:
Сігналы абмеркавання Т-вредност = н1 + н2−2 (н1−1) × вар12 + (н2−1) × вар22 × н11 + н21 средња1 - средња2 где: средња вредност1 и средња вредност2 = Просечне вредности за узорке скупа1 и вар2 = Варијанта сваког узорка скупа н1 и н2 = Број записа у сваком скупу узорака
и, Сігналы абмеркавання Ступњеви слободе = н1 + н2−2 другде: н1 и н2 = број записа у сваком скупу узорака
Т-тест неравномерне варијанце
Т-тест неравномерне варијанце користи се када је број узорака у свакој групи различит, а варијанца двају скупа података је такође различита. Овај тест се назива и Велцхов т-тест. Следећа формула се користи за израчунавање т-вредности и степена слободе за т-тест неравномерне варијанце:
Сігналы абмеркавання Т-вредност = н1вар12 + н2вар22 средња1 - средња2 где: средња вредност1 и средња вредност2 = Просечне вредности узорака скупавар1 и вар2 = Варијанца сваког узорка скупа н1 и н2 = Број записа у сваком узорку скупа
и, Сігналы абмеркавання Ступњеви слободе = н1−1 (н1вар12) 2 + н2−1 (н2вар22) 2 (н1вар12 + н2вар22) 2 где су: вар1 и вар2 = Варијанца сваког узорка скупа н1 и н2 = Број записа у сваком скупу узорака
Одређивање исправног Т-теста за употребу
Следећа дијаграм тока може се користити за одређивање т-теста који се користи на основу карактеристика скупа узорака. Кључне ставке које треба узети у обзир укључују јесу ли узорци записа слични, број записа података у сваком скупу узорака и варијанца сваког узорка.
Слика Јулие Банг © Инвестопедиа 2019
Пример теста неједнаке варијанце
Претпоставимо да вршимо дијагонално мерење слика примљених у уметничкој галерији. Једна група узорака укључује 10 слика, док друга садржи 20 слика. Скупови података са одговарајућим средњим и вредностима одступања су следећи:
Сет 1 | Сет 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Значити | 19.4 | 21.6 |
Променљив | 1.4 | 17.1 |
Иако је средина скупа 2 већа од просека скупа 1, не можемо закључити да све слике имају просечну дужину око 21, 6 јединица јер је варијанца скупа 2 значајно већа од сета 1. Да ли је то случајно или заиста постоје разлике у целокупној популацији свих слика добијених у уметничкој галерији? Проблем успостављамо претпостављањем нулте хипотезе да је средња вредност једнака између два скупа узорака и спроводимо т-тест како бисмо потврдили да ли је хипотеза тачна.
Како је број записа података различит (н1 = 10 и н2 = 20), а варијанца је такође различита, т-вредност и степени слободе израчунавају се за горњи скуп података користећи формулу наведену у Т-тесту неравномерне варијанце. одељак.
Вредност т износи -2.24787. Пошто се знак минус може занемарити приликом поређења две т-вредности, израчуната вредност је 2, 224787.
Степен вредности слободе износи 24, 38 и смањује се на 24, захваљујући дефиницији формуле која захтева заокруживање вредности на најмању могућу целобројну вредност.
Кад год се претпостави нормална дистрибуција, може се одредити ниво вероватноће (алфа ниво, ниво значаја, п ) као критеријум за прихватање. У већини случајева може се претпоставити 5% вредност.
Користећи степен вредности слободе као 24 и 5-постотни значај, поглед на табелу расподјеле т-вриједности даје вриједност од 2.064. Упоређивање ове вредности са израчунатом вредношћу од 2, 224 показује да је израчуната т-вредност већа од вредности табеле на нивоу значајности од 5%. Стога је сигурно одбацити ништавну хипотезу да не постоји разлика између средстава. Скуп становништва има интринзичне разлике и нису случајно.
Упоредите инвестиционе рачуне × Понуде које се појављују у овој табели су из партнерстава од којих Инвестопедиа прима накнаду. Опис добављача ОписСродни услови
Како функционира анализа варијанце (АНОВА) Анализа варијанце (АНОВА) је алат за статистичку анализу који укупну варијабилност која се налази унутар скупа података одваја на двије компоненте: случајни и систематски фактори. више Дефиниција З-теста З-тест је статистички тест који се користи да се утврди да ли су два средства популације различита када су познате варијанције и величина узорка. више Ступњеви слободе Ступњеви слободе се односе на максимални број логички независних вредности које су вредности које имају слободу да се разликују у узорку података. више Разумевање Т Дистрибуција АТ дистрибуција је врста вероватноће функције која је погодна за процењивање параметара популације за мале величине узорка или непознате варијанце. више Шта мере полудржања Семи-девијација је метода за процену нижих средњих колебања у приносу од улагања. Користи се као алтернатива стандардном одступању. више Бонферрони тест Бонферрони тест је врста вишеструког упоредног теста који се користи у статистичкој анализи. више партнерских везаповезани чланци
Економија
Које претпоставке се дају приликом спровођења т-теста?
Управљање ризиком
Коришћење историјске променљивости за процену будућег ризика
Стоцк Традинг Стратеги & Едуцатион
Како користити Екцел за симулацију цена акција
Финансијски показатељи
Како се израчунава ИРР у Екцелу?
Математика и статистика
Шта је релативна стандардна грешка
Финансијски показатељи
Која је формула за израчунавање нето садашње вредности (НПВ) у Екцелу?
