Шта су непараметријске статистике?
Непараметријска статистика односи се на статистичку методу у којој се подаци не захтевају да би се прилагодили нормалној дистрибуцији. Непараметријска статистика користи податке који су често редовни, што значи да се не ослањају на бројеве, већ на рангирање или редослед врста. На пример, анкета која преноси преференције потрошача у распону од не свиђају се сматрала би редоследним подацима.
Непараметријска статистика укључује непараметријске описне статистике, статистичке моделе, закључке и статистичке тестове. Структура модела непараметријских модела није одређена а приори већ је уместо тога одређена из података. Израз непараметријски не подразумева да такви модели потпуно немају параметре, већ да су број и природа параметара флексибилни и нису унапред одређени. Хистограм је пример непараметријске процене расподеле вероватноће.
Разумевање непараметријске статистике
У статистици, параметријска статистика укључује параметре као што су средња, средња, стандардна девијација, варијанца итд. Овај облик статистике користи проматране податке за процену параметара дистрибуције. Под параметријском статистиком претпоставља се да подаци одговарају нормалној дистрибуцији са непознатим параметрима μ (просечна популација) и σ 2 (варијанца популације), који се затим процењују коришћењем средње вредности узорка и варијанце узорка.
Непараметријска статистика не претпоставља о величини узорка или о томе да ли су посматрани подаци квантитативни.
Непараметријска статистика не претпоставља да су подаци добијени из нормалне дистрибуције. Уместо тога, облик дистрибуције процењује се према овом облику статистичког мерења. Иако постоје многе ситуације у којима се може претпоставити нормална дистрибуција, постоје и одређени сценарији у којима неће бити могуће одредити да ли ће се подаци нормално дистрибуирати.
Примери непараметријске статистике
У првом примеру размотрите истраживача који жели да процена броја беба у Северној Америци рођених смеђих очију може одлучити да узме узорак од 150.000 беба и изврши анализу на скупу података. Мерење које добивају користиће се за процену целокупне популације беба са смеђим очима рођеним следеће године.
За други пример, размислите о другом истраживачу који жели да зна да ли је одлазак у кревет рано или касно повезан са колико често неко оболи. Под претпоставком да је узорак одабран насумично из популације, може се претпоставити да је расподјела величине узорка у учесталости болести нормална. Међутим, не може се претпоставити да експеримент који мери отпорност људског тела на сој бактерија има нормалну дистрибуцију.
То је зато што случајно одабрани подаци узорка могу бити отпорни на сој. С друге стране, ако истраживач размотри факторе као што су генетска структура и етничка припадност, може открити да величина узорка одабрана помоћу ових карактеристика можда није отпорна на сој. Стога се не може претпоставити нормална дистрибуција.
Ова метода је корисна када подаци немају јасну нумеричку интерпретацију и најбоље их је користити са подацима који имају сортирање. На пример, тест за оцену личности може да има рангирање својих метрика који се постављају као изразито нескладни, не слажући се, равнодушни, слажу се и снажно се слажу. У овом случају треба користити непараметријске методе.
Посебна разматрања
Непараметријска статистика добила је на угледу због своје једноставности употребе. Како се потреба за параметрима смањује, подаци постају применљивији на већи број тестова. Ова врста статистике може се користити без средње вриједности, величине узорка, стандардног одступања или процјене било којег другог сродног параметра када ниједан од тих података није доступан.
Будући да непараметријска статистика чини мање претпоставки о узоркованим подацима, њена примена је ширег обима од параметријске статистике. У случајевима када је параметријско тестирање погодније, непараметријске методе ће бити мање ефикасне. То је зато што резултати добијени из непараметријске статистике имају нижи степен поузданости него ако су резултати добијени коришћењем параметријске статистике.
Кључне Такеаваис
- Непараметријске статистике су једноставне за употребу, али не нуде прецизну тачност осталих статистичких модела. Ова врста анализе је најприкладнија за разматрање редоследа нечега, где чак и ако се нумерички подаци мењају, резултати ће вероватно остати исти.
