Парадоксът на Симпсън

Парадоксът на Симпсън е парадокс от статистиката. Наречен е на Едуард Симпсън, британски статистик, който го описва за първи път през 1951 г. Статистикът Карл Пиърсън описва много подобен ефект през 1899 г. - Описанието на Удни Юл е от 1903 г. Понякога той се нарича ефект на Юл-Симпсън. Когато се разглеждат статистическите резултати на групи, тези резултати могат да се променят в зависимост от това дали групите се разглеждат една по една, или се обединяват в по-голяма група. Този случай често се среща в социалните науки и медицинската статистика. Той може да обърка хората, ако данните за честотата се използват за обяснение на причинно-следствена връзка. Други наименования на парадокса включват парадокс на обръщането и парадокс на сливането.

Пример: Лечение на камъни в бъбреците

Това е реален пример от медицинско проучване, в което се сравнява успеваемостта на две лечения на камъни в бъбреците.

В таблицата са показани процентите на успеваемост и броят на леченията при лечение на малки и големи камъни в бъбреците, като лечение А включва всички отворени процедури, а лечение Б - перкутанна нефролитотомия:

Лечение А

Лечение В

успех

отказ

успех

отказ

Малки камъни

Група 1

Група 2

брой пациенти

81

6

234

36

93%

7%

87%

13%

Големи камъни

Група 3

Група 4

брой пациенти

192

71

55

25

73%

27%

69%

31%

И двата сайта

Група 1+3

Група 2+4

брой пациенти

273

77

289

61

78%

22%

83%

17%

Парадоксалното заключение е, че лечението А е по-ефективно, когато се използва при малки камъни, както и при големи камъни, но лечението Б е по-ефективно, когато се разглеждат едновременно и двата размера. В този пример не е известно, че размерът на камъка в бъбреците влияе върху резултата. В статистиката това се нарича скрита променлива (или прикрита променлива).

Кое лечение се счита за по-добро, се определя от неравенството между две съотношения (успехи/общо). Обръщането на неравенството между съотношенията, което създава парадокса на Симпсън, се случва, защото два ефекта се проявяват заедно:

  1. Размерите на групите, които се комбинират, когато се пренебрегне променливата "дебнене", са много различни. Лекарите са склонни да дават на тежките случаи (големи камъни) по-доброто лечение (А), а на по-леките случаи (малки камъни) - по-лошото лечение (Б). Поради това общите стойности са доминирани от групи три и две, а не от двете много по-малки групи едно и четири.
  2. Променливата "lurking" оказва голямо влияние върху съотношенията, т.е. процентът на успеваемост се влияе по-силно от тежестта на случая, отколкото от избора на лечение. Следователно групата пациенти с големи камъни, използващи лечение А (трета група), се справя по-зле от групата с малки камъни, дори ако последните са използвали по-лошото лечение В (втора група).

AlegsaOnline.com - 2020 / 2023 - License CC3