Dlaczego margaryna sprzyja rozwodom, a wzrost wydatków na naukę prowadzi do epidemii samobójczych śmierci, czyli jak nie dać się zwieść magii wykresów.

Zacznijmy od innego dramatycznego pytania. Czy za coraz częstsze przypadki autyzmu odpowiada wzrost sprzedaży żywności ekologicznej? Nie? Ale spójrzmy na wykres - dane mówią same za siebie.

Jeśli zaznaczyć liczbę corocznie diagnozowanych przypadków autyzmu od roku 1998 do 2009, to nałoży się ona z krzywą obrazującą wartość sprzedaży produktów ekologicznych w milionach dolarów .

Podobnie istnieje silna korelacja między sprzedażą margaryny w danym roku a liczbą rozwodów przypadającą na każde sto par. Jakie mogą być przyczyny tak dziwnej zależności? Może margaryna jest czynnikiem wzbudzającym małżeńskie kontrowersje?

- Kochanie, znowu kupiłeś margarynę? Tyle razy cię prosiłam, żebyś raczej brał masło - czytałam, że jest zdrowsze.

- Idiotyzm! Masło nie jest zdrowsze! Zresztą proszę bardzo - możesz sama chodzić po zakupy. Ale ty zawsze masz pilniejsze sprawy. Prawdę mówiąc, podejrzewam, że po prostu nie chce ci się ganiać z wózkiem w supermarkecie. Wszystko jest na mojej głowie, żadnej pomocy...

I tak dalej - prosto do rozwodu.

Dość żartów. Może margaryna zawiera jakieś składniki, które wpływają - dajmy na to - na wydzielanie się hormonów stresu? Albo obniżają poziom serotoniny, odpowiedzialnej za poczucie spełnienia i szczęścia?

Jak matematyka zmienia nasze życie

Pozory mylą

No dobrze. Ale jakim cudem powstaje korelacja między konsumpcją sera a liczbą osób, które poniosły śmierć na skutek zaplątania się w pościeli? Czyżby ser powodował koszmary nocne prowokujące do nieopanowanego szamotania się w łóżku? Albo skąd proporcjonalność między liczbą osób, które utonęły, wypadłszy z łodzi rybackich, a liczbą małżeństw zawieranych na tysiąc mieszkańców w Kentucky? Może rybołówstwo jest tradycyjnym zajęciem par podczas miodowego miesiąca w tym rejonie?

I w końcu, dlaczego wzrost wydatków rządu amerykańskiego na naukę, technologię i przemysł kosmiczny idzie w parze ze wzrostem liczb samobójstw przez powieszenie i uduszenie?

Te i setki innych przykładów całkowicie absurdalnych zależności pochodzą ze znakomitej strony " Spurious correlations " stworzonej przez Tylera Vigena, studenta pierwszego roku kryminologii w Harvard Law School. Napisał on program przekopujący setki danych statystycznych i wydobywający podobieństwa w zmianach trendów różnych, zupełnie ze sobą niepowiązanych wielkości - od nasłonecznienia w poszczególnych obszarach świata przez populację pszczół po przypadki dziwnych zgonów.

Wyjaśnienie wszystkich osobliwych zależności jest tylko jedno, za to tłumaczy wszystkie wspomniane fenomeny za jednym zamachem - i bardzo przekonująco. Pozorne korelacje są... pozorne. I tyle.

Ponieważ korelacja wcale nie oznacza zależności przyczynowo-skutkowej.

Z tego, że jakieś dwie wielkości mają podobny trend rosnący czy malejący w poszczególnych okresach, wcale nie wynika, że są połączone w jakiś sensowny sposób i wpływają na siebie nawzajem. Część zgodności może być całkowicie przypadkowa. Jest niczym więcej jak tylko zbiegiem okoliczności. Inne wynikają z istnienia jakichś nieznanych czynników wpływających jednocześnie na obie z obserwowanych wielkości. Przykłady? Bardzo proszę.

Trzeci gracz

Znana jest korelacja między liczbą gniazd bocianich w najbliższym sąsiedztwie a liczbą dzieci w gospodarstwie domowym. Im więcej bocianów, tym większa dzietność. Czy to dowodzi teorii, że dzieci przynoszone są przez boćki i składowane w kapuście? Bynajmniej. Ale bociany osiedlają się na terenach wiejskich, a współczynnik przyrostu naturalnego na nich (obojętne, zasiedlonych przez bociany czy nie) jest wyższy niż w miastach. Stąd pozorna zależność.

Inny przykład: zimą spada sprzedaż lodów, a rośnie liczba wypadków samochodowych. Czy to znaczy, że lody powiązane są z bezpieczeństwem na drogach? Bynajmniej. Być może w grę wchodzi jakaś trzecia zmienna - na przykład temperatura. Spadek temperatury może tłumaczyć zarówno trudne warunki na szosach, jak i niechęć do zimnych deserów.

Po kilkunastu latach od upowszechnienia się hormonalnej terapii zastępczej dla kobiet zauważono, że panie, które ją przyjmują, znacznie rzadziej zapadają na chorobę wieńcową serca. Niektórzy lekarze zaczęli podejrzewać, że hormonalna terapia zastępcza chroni przed zawałem. Czy faktycznie?

Nie. Tutaj znowu istotna okazała się trzecia, niezauważona wcześniej zmienna - status materialny i społeczny. Po HTZ sięgają częściej kobiety bogatsze i lepiej wykształcone. One też lepiej się odżywiają, bardziej dbają o siebie, częściej uprawiają sporty. I to właśnie zdrowy tryb życia - a nie terapia hormonalna - był czynnikiem chroniącym serce. W rzeczywistości, jak się okazało po szczegółowszych analizach, sama hormonalna terapia zastępcza nieznacznie podnosi ryzyko miażdżycy i kłopotów z sercem.

Zdumiewające zdjęcie - fizycy sfotografowali kota Schroedingera

Poszukiwany: krytycznie myślący

Łatwo jest dać się uwieść uwodzicielskiej mocy wykresów. Liczby w zbiorach danych bywają trudne do ogarnięcia. Całkiem inaczej sprawa się ma z rysunkami. O ile łatwiej jest przekonać kogoś, pokazując mu dwie zgodnie wznoszące się i opadające linie.

Tymczasem - jak przyznaje sam Vigen - wiele z jego wykresów nie ilustruje skorelowanych statystycznie wielkości, ale są one tak narysowane, by robiły przekonujące wrażenie. W końcu, kiedy bierzesz do analizy siedem czy dziesięć punktów, możesz poprowadzić przez nie najdziksze krzywe.

Jedną z pułapek naszych czasów jest to, że umiemy gromadzić (i gromadzimy) naprawdę ogromne ilości danych. Potrafimy rzucić potężne moce obliczeniowe do ich analizy. W efekcie jesteśmy w stanie wydobyć z naszych danych mnóstwo korelacji najróżniejszego typu. Znakomita większość z nich będzie funta kłaków warta. Dlatego tak ważne są dyscyplina naukowa przy ich analizie, umiejętność wydobywania korelacji statystycznie istotnych i badanie, czy między analizowanymi wielkościami zachodzi związek przyczynowy.

A dlaczego w ogóle łapiemy się na te pozorne zależności? Czemu pociąga nas magia wykresów i liczb oraz dlaczego doszukujemy się w nich rozmaitych prawidłowości, choćby żadnej tam nie było?

To wszystko wina naszego mózgu. On najbardziej w świecie nie znosi niedomówień, białych plam i niekonsekwencji.

Jak miałby sobie radzić z nawałem rozmaitych bodźców, jeśli nie usiłowałby z nich stworzyć konsekwentnego obrazu świata? Bez mechanizmu odnajdywania powiązań, związków (nawet tam, gdzie ich nie ma) nie bylibyśmy w stanie normalnie funkcjonować.

Dlatego zawsze będziemy próbowali wyeliminować niespójności z naszego światopoglądu. Mówi o tym teoria dysonansu poznawczego Leona Festingera. Badacz ten zauważył, że kiedy stajemy wobec dwóch niezgodnych elementów poznawczych - przekonań, opinii, wiadomości - czujemy się z tym niekomfortowo i usiłujmy zmienić jeden z nich. Jak? Najchętniej bez wysiłku, czyli na skróty.

A takim umysłowym skrótem jest korelacja. Uproszczony obraz rzeczywistości, który często przeradza się w ludową mądrość, czyli stereotyp. Odnoszący się do grup społecznych, osób, sytuacji, instytucji, utrwalony wielokrotnym powtarzaniem. Stereotypy przyswajamy bardzo wcześnie, poznając świat i ucząc się. Są jak zakładki w ogromnym katalogu. Mózg za ich pomocą upraszcza rzeczywistość, co pomaga mu segregować dane.

Nie dajmy się zwariować! Od czasu do czasu wyłączmy ten umysłowy autopilot i włączmy zdrowy rozsądek.

Czy czekolada pomaga w zdobyciu Nagrody Nobla?

Komentarze
No właśnie. Bardzo dobry artykuł. Całą teoria o szkodliwości tłuszczu, cholesterolu opiera się właśnie na fałszywej korelacji między poziomem spożywania tłuszczów zwierzęcych a umieralnością na choroby serca. Korelacje te opracował Ancel Keys (dodatkowo dane spreparował, aby lepiej pasowały do jego tezy). Niestety, udało mu się przekonać ważne komisje w USA i w konsekwencji pół świata. Od tej pory koncerny farmaceutyczne zarobiły 50 mld dolarów na sprzedaży statyn obniżających poziom cholesterolu. A wszystko to przez fałszywe korelacje. Zazwyczaj w takich przypadkach musi być jeszcze 'paradoks'. W badaniach Keysa był to przypadek Francji, gdzie spożycie tłuszczów było wysokie a śmiertelność na serce niska. Jeden z lekarzy walczących z tą teorią, Uffe Ravnskov opracował korelację między poziomem posiadani iphonów w danej populacji, a umieralnością na AIDS. I też był paradoks - RPA, gdzie jest dużo iphonów i jednocześnie duża umieralność na AIDS.
już oceniałe(a)ś
2
3
Facet, który woli margarynę od masła? Śmiechu warty przykład wzięliście...
już oceniałe(a)ś
1
3