Парадоксът на Симпсън
Парадоксът на Симпсън е парадокс от статистиката. Наречен е на Едуард Симпсън, британски статистик, който го описва за първи път през 1951 г. Статистикът Карл Пиърсън описва много подобен ефект през 1899 г. - Описанието на Удни Юл е от 1903 г. Понякога той се нарича ефект на Юл-Симпсън. Когато се разглеждат статистическите резултати на групи, тези резултати могат да се променят в зависимост от това дали групите се разглеждат една по една, или се обединяват в по-голяма група. Този случай често се среща в социалните науки и медицинската статистика. Той може да обърка хората, ако данните за честотата се използват за обяснение на причинно-следствена връзка. Други наименования на парадокса включват парадокс на обръщането и парадокс на сливането.
Пример: Лечение на камъни в бъбреците
Това е реален пример от медицинско проучване, в което се сравнява успеваемостта на две лечения на камъни в бъбреците.
В таблицата са показани процентите на успеваемост и броят на леченията при лечение на малки и големи камъни в бъбреците, като лечение А включва всички отворени процедури, а лечение Б - перкутанна нефролитотомия:
Лечение А | Лечение В | |||
успех | отказ | успех | отказ | |
Малки камъни | Група 1 | Група 2 | ||
брой пациенти | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Големи камъни | Група 3 | Група 4 | ||
брой пациенти | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
И двата сайта | Група 1+3 | Група 2+4 | ||
брой пациенти | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Парадоксалното заключение е, че лечението А е по-ефективно, когато се използва при малки камъни, както и при големи камъни, но лечението Б е по-ефективно, когато се разглеждат едновременно и двата размера. В този пример не е известно, че размерът на камъка в бъбреците влияе върху резултата. В статистиката това се нарича скрита променлива (или прикрита променлива).
Кое лечение се счита за по-добро, се определя от неравенството между две съотношения (успехи/общо). Обръщането на неравенството между съотношенията, което създава парадокса на Симпсън, се случва, защото два ефекта се проявяват заедно:
- Размерите на групите, които се комбинират, когато се пренебрегне променливата "дебнене", са много различни. Лекарите са склонни да дават на тежките случаи (големи камъни) по-доброто лечение (А), а на по-леките случаи (малки камъни) - по-лошото лечение (Б). Поради това общите стойности са доминирани от групи три и две, а не от двете много по-малки групи едно и четири.
- Променливата "lurking" оказва голямо влияние върху съотношенията, т.е. процентът на успеваемост се влияе по-силно от тежестта на случая, отколкото от избора на лечение. Следователно групата пациенти с големи камъни, използващи лечение А (трета група), се справя по-зле от групата с малки камъни, дори ако последните са използвали по-лошото лечение В (втора група).