Доверителен интервал — определение, доверително ниво и изчисляване

Доверителен интервал: какво представлява, как се определя доверителното ниво и как се изчислява — ясно обяснение с примери и статистически предположения.

Автор: Leandro Alegsa

В статистиката доверителният интервал е метод за оценка на неизвестен параметър, при който вместо една точкова оценка се дава интервал от допустими стойности за параметъра, съпроводен с вероятностна мярка за надеждността на този интервал. Тази вероятност се нарича доверително ниво и обикновено се изразява като процент (например 90%, 95% или 99%). Крайните точки на интервала се наричат доверителни граници. За дадена процедура за оценка и при една и съща извадка доверителният интервал е фиксиран, но ако повтаряме извадките многократно, интервалите ще варират; свойството на доверителния интервал е, че при огромен брой повторения приблизително дадена част (напр. 95%) от тези интервали ще съдържат истинската стойност на параметъра.

Как да се интерпретира доверителният интервал

Важно е да се отличи честото неразбиране: за един конкретен изчислен интервал не е коректно да се твърди, че „има 95% вероятност реалният параметър да лежи в този конкретен интервал“ в смисъла на случайно събитие—в класическата (фреквентистка) рамка параметърът е фиксиран, а интервалът е случаен. Коректната честотна интерпретация е: ако повторим процедурата за събиране на извадки и изграждане на доверителни интервали много пъти, приблизително 95% от тези интервали ще покрият истинската стойност. Ако предпочитате интуитивно тълкуване, понякога се използва и език от байесианския подход (кредибъл интервал), но това е различна концепция и изисква задаване на априорно разпределение.

Основни фактори, влияещи на ширината на доверителния интервал

  • Доверително ниво: колкото по-високо е нивото (напр. 99% вместо 95%), толкова по-широк става интервалът.
  • Размер на извадката n: ширината намалява приблизително с корен квадратен от n (∝ 1/√n).
  • Разсейване/вариативност на данните: по-голяма стандартна грешка увеличава ширината.
  • Използван статистически модел и допускания: при грешни допускания (например дали популацията е нормално разпределена) покритието може да се промени.

Често използвани методи за изчисляване

Изчисляването на доверителния интервал обикновено изисква предположения за модела на данните и е предимно параметричен подход, но има и непараметрични методи (bootstrap). Ето някои стандартни случаи и формули (за двустранни интервали):

  • Средна стойност при известна стандартна девиация σ:
    x̄ ± z_{α/2} * (σ / √n)
    където z_{α/2} е критична стойност от стандартното нормално разпределение (напр. за 95% z≈1.96).
  • Средна стойност при неизвестна σ:
    x̄ ± t_{n−1, α/2} * (s / √n)
    тук се използва t-разпределение с n−1 степен(и) на свобода, а s е стандартното отклонение на извадката.
  • Дял (пропорция) в биноминална ситуация (приблизително):
    p̂ ± z_{α/2} * √(p̂(1−p̂)/n)
    За малки n или екстремни p̂ по-надеждни са методи като Clopper–Pearson (точен), Wilson или Agresti–Coull.
  • За дисперсия/варианс на нормално разпределение:
    използват се χ²-критични стойности за границите на вариансния интервал.
  • Непараметрични/Bootstrap методи:
    перцентилен bootstrap, BCa и други дават надеждни интервали при нарушени допускания или сложни статистики.

Практически стъпки за изчисляване на доверителен интервал

  • Изберете подходящата оценка (напр. x̄, p̂) и изчислете нейната стандартна грешка.
  • Изберете доверителното ниво (1−α) и съответната критична стойност (z или t или друг критерий).
  • Изчислете границите: оценка ± (критична стойност) × (стандартна грешка).
  • Проверете допусканията (нормалност, независимост, достатъчно голям n) и при нужда използвайте алтернативни методи (напр. bootstrap).

Свързани понятия и предупреждения

  • Доверителният интервал е тясно свързан с теста на хипотези: ако нулевата хипотеза (например θ0) не е включена в (1−α) доверителния интервал, тя обикновено се отхвърля при ниво α.
  • Номиналното доверително ниво (напр. 95%) може да не съвпада с действителното покритие, ако допусканията са нарушени.
  • Има разлика между фреквентистки доверителен интервал и байесиански кредибъл интервал; двата подхода имат различни интерпретации и изисквания.
  • За практическа употреба често се препоръчва да се посочват и допусканията, методът на изчисление и размера на извадката за по-добра прозрачност.

В обобщение, доверителният интервал дава полезна информация за несигурността при оценяването на параметри, но трябва да се използва внимателно — като се имат предвид допусканията, размера на извадката и правилната интерпретация на резултатите.

Значение на термина "доверие"

Терминът "доверие" има подобно значение в статистиката, както и в общата употреба. В обикновената употреба твърдението за 95% увереност в нещо обикновено се приема като указание за почти пълна сигурност. В статистиката твърдението за 95% увереност просто означава, че изследователят е видял един възможен интервал от голям брой възможни, от които деветнадесет от двадесет интервала съдържат истинската стойност на параметъра.

Практически пример

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Машината пълни чаши с маргарин. За примера машината е настроена така, че съдържанието на чашките да е 250 г маргарин. Тъй като машината не може да напълни всяка чаша с точно 250 g, съдържанието, добавено в отделните чаши, показва известно вариране и се счита за случайна величина X. Приема се, че това вариране е нормално разпределено около желаната средна стойност от 250 g със стандартно отклонение от 2,5 g. За да се определи дали машината е адекватно калибрирана, произволно се избира извадка от n = 25 чаши с маргарин и чашите се претеглят. Теглата на маргарина са X1, ..., X25, случайна извадка от X.

За да се добие представа за очакването μ, е достатъчно да се даде оценка. Подходящата оценка е средната стойност на извадката:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

В извадката са показани действителните тегла x1, ...,x25 със средна стойност:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 грама . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250,2\,{\text{grams}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Ако вземем друга извадка от 25 чаши, лесно можем да очакваме да открием стойности като 250,4 или 251,1 грама. Средна стойност на извадката от 280 грама обаче би била изключително рядка, ако средното съдържание на чашите всъщност е близко до 250 грама. Около наблюдаваната стойност 250,2 на средната стойност на извадката има цял интервал, в който, ако средната стойност на цялата популация действително приеме стойност в този интервал, наблюдаваните данни не биха се считали за особено необичайни. Такъв интервал се нарича доверителен интервал за параметъра μ. Как се изчислява такъв интервал? Крайните точки на интервала трябва да се изчислят от извадката, така че те са статистически данни, функции на извадката X1, ..., X25 и следователно самите те са случайни величини.

В нашия случай можем да определим крайните точки, като вземем предвид, че средната стойност на извадката X от нормално разпределена извадка също е нормално разпределена, със същото очакване μ, но със стандартна грешка σ/√n = 0,5 (грама). Чрез стандартизиране получаваме случайна променлива

Z = X¯ - μ σ / n = X¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

зависи от параметъра μ, който трябва да бъде оценен, но със стандартно нормално разпределение, независимо от параметъра μ. Следователно е възможно да се намерят числа -z и z, независими от μ, където Z се намира между тях с вероятност 1 - α, мярка за това колко уверени искаме да бъдем. Ние приемаме 1 - α = 0,95. Така че имаме:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Числото z следва от кумулативната функция на разпределение:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

и получаваме:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X¯ - 1,96 × 0,5 ≤ μ ≤ X¯ + 1,96 × 0,5 ) = P ( X¯ - 0,98 ≤ μ ≤ X¯ + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\кратна 0,5\права)\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\права).\end{aligned}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Това може да се тълкува по следния начин: с вероятност 0,95 ще намерим доверителен интервал, в който ще срещнем параметъра μ между стохастичните крайни точки

X¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

и

X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Това не означава, че има вероятност параметърът μ да се срещне в изчисления интервал с вероятност 0,95. Всеки път, когато измерванията се повтарят, ще има друга стойност за средната стойност X на извадката. В 95 % от случаите μ ще бъде между крайните точки, изчислени от тази средна стойност, но в 5 % от случаите няма да е така. Действителният доверителен интервал се изчислява чрез въвеждане на измерените тегла във формулата. Нашият доверителен интервал от 0,95 става:

( x¯ - 0,98 ; x¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Тъй като желаната стойност 250 на μ е в рамките на получения доверителен интервал, няма причина да се смята, че машината е неправилно калибрирана.

Изчисленият интервал има фиксирани крайни точки, като μ може да се намира между тях (или не). Следователно това събитие има вероятност 0 или 1. Не можем да кажем: "с вероятност (1 - α) параметърът μ лежи в доверителния интервал." Знаем само, че при повторение в 100(1 - α) % от случаите μ ще се намира в изчисления интервал. В 100α % от случаите обаче това не е така. И за съжаление не знаем в кои от случаите се случва това. Ето защо казваме: "при ниво на доверителност 100(1 - α) % μ се намира в доверителния интервал. "

На фигурата вдясно са показани 50 реализации на доверителен интервал за дадена средна стойност на популацията μ. Ако изберем произволно една реализация, вероятността да изберем интервал, който съдържа параметъра, е 95 %; може обаче да нямаме късмет и да сме избрали грешната реализация. Никога няма да разберем; ние сме останали с нашия интервал.

Вертикалните линейни сегменти представляват 50 реализации на доверителния интервал за μ.Zoom
Вертикалните линейни сегменти представляват 50 реализации на доверителния интервал за μ.

Въпроси и отговори

В: Какво представлява доверителният интервал в статистиката?


О: Доверителен интервал е специален интервал, използван за оценка на параметър, като например средната стойност на популацията, като вместо една стойност се дава диапазон от приемливи стойности за параметъра.

В: Защо се използва доверителен интервал вместо една стойност?


О: Доверителен интервал се използва вместо една стойност, за да се отчете несигурността при оценяването на параметър въз основа на извадка и да се даде вероятност реалната стойност на параметъра да е в рамките на интервала.

В: Какво е доверително ниво?


О: Доверителното ниво е вероятността оценяваният параметър да е в рамките на доверителния интервал и често се дава в проценти (напр. 95 % доверителен интервал).

В: Какво представляват доверителните граници?


О: Доверителните граници са крайните точки на доверителния интервал, които определят диапазона на приемливите стойности за оценявания параметър.

В: Как нивото на доверителност влияе на доверителния интервал?


О.: При дадена процедура за оценяване колкото по-високо е доверителното ниво, толкова по-широк е доверителният интервал.

В: Какви предположения са необходими за изчисляване на доверителния интервал?


О.: Изчисляването на доверителния интервал обикновено изисква предположения за естеството на процеса на оценяване, като например предположението, че разпределението на популацията, от която идва извадката, е нормално.

В: Доверителните интервали надеждна статистика ли са?


О.: Както е разгледано по-долу, доверителните интервали не са надеждна статистика, въпреки че могат да се направят корекции, за да се добави надеждност.


обискирам
AlegsaOnline.com - 2020 / 2025 - License CC3