Шта је лажна корелација
У статистици се лажна корелација, или лажна, односи на везу између две променљиве која се чини узрочно, али није. Лажни односи често имају изглед једне променљиве која утиче на другу. Ова лажна корелација често је узрокована трећим фактором који није очигледан у тренутку испитивања, који се понекад назива и збуњујући фактор.
Кључне Такеаваис
- Лажна корелација или лажљивост је када се два чиниоца појављују случајно повезана, али нису. Појава узрочно-посљедичне везе често је последица сличног кретања на графикону које испада да је случајно или је узроковано трећим „збуњујућим“ фактором. Лажна корелација често могу бити узроковане малим величинама узорка или произвољним крајњим тачкама.
Како дјелује лажна корелација
Кад се две случајне променљиве међусобно прате на графикону, лако је посумњати у корелацију или однос између два фактора, где промена утиче на другу. Одбацујући "узрочно", другу тему, ово запажање може навести читаоца графикона да верује да је кретање променљиве А повезано са кретањем у променљивој Б или обрнуто. али понекад, након пажљивијег статистичког испитивања, поравнати покрети су случајни или су узроковани трећим фактором који утиче на прва два. Ово је лажна корелација. Истраживање рађено с малим величинама узорака или произвољним крајњим тачкама је посебност подложна лажљивости.
Пример лажних корелација
Откривати занимљиве корелације није превише тешко. Међутим, многи ће испасти лажни. За мушку врсту на Валл Стреету, две популарне лажне корелације укључују жене и спорт. Из 1920-их потиче теорија дужине сукње, која држи да су дужине сукње и правац берзе корелирани. Ако су сукње дуге, то значи да берза опада; ако су кратки, тржиште расте. Крајем јануара се говори о такозваном показатељу Супер Бовла, који сугерише да победа екипе АФЦ вероватно значи да ће берза у наредној години пасти, док победа НФЦ тима представља пораст у тржиште. Од 1966. године, показатељ је имао тачност од 80%. То је забаван део разговора, али вероватно није нешто што би озбиљни финансијски саветници препоручили као инвестициону стратегију за клијенте.
Ево још неколико примера уобичајених лажних корелација:
- Утапања расту када порасте продаја сладоледа. Можда се чини да повећана продаја сладоледа узрокује више утапања, али у стварности, растућа врућина може натјерати више људи да пливају, као и купују више сладоледа. Стопа убиства у САД-у од 2006. до 2011. пала је истом брзином као и Мицрософт Интернет Екплорер употреба. Извршиоци који кажу молим вас и захваљују вам чешће уживају у бољем дељењу перформанси. Људи који носе опрему тима Оакланд Раидерс вероватније ће починити злочине.
Како уочити лажне корелације
Статистичари и други научници који анализирају податке морају бити стално у потрази за лажним везама. Постоје бројне методе које користе, укључујући:
- Обезбеђивање одговарајућег репрезентативног узорка. Добијање одговарајуће величине узорка. Обавезно пазити на произвољне крајње тачке. Контролирати за што је могуће више спољних променљивих. Коришћењем нулте хипотезе и проверавањем јаке п-вредности.
