Доверителен интервал
В статистиката доверителният интервал е специална форма на оценка на определен параметър. При този метод вместо една стойност се дава цял интервал от допустими стойности за параметъра, както и вероятността реалната (неизвестна) стойност на параметъра да е в интервала. Доверителният интервал се основава на наблюденията от дадена извадка и следователно се различава в отделните извадки. Вероятността, че параметърът ще бъде в интервала, се нарича доверително ниво. Много често то се дава като процент. Доверителният интервал винаги се дава заедно с доверителното ниво. Хората могат да говорят за "95% доверителен интервал". Крайните точки на доверителния интервал се наричат доверителни граници. За дадена процедура за оценка в дадена ситуация, колкото по-високо е доверителното ниво, толкова по-широк ще бъде доверителният интервал.
Изчисляването на доверителния интервал обикновено изисква предположения за естеството на процеса на оценяване - това е предимно параметричен метод. Едно от най-често срещаните допускания е, че разпределението на популацията, от която е направена извадката, е нормално. По този начин доверителните интервали, както са разгледани по-долу, не са надеждна статистика, въпреки че могат да се направят промени, за да се добави надеждност.
Значение на термина "доверие"
Терминът "доверие" има подобно значение в статистиката, както и в общата употреба. В обикновената употреба твърдението за 95% увереност в нещо обикновено се приема като указание за почти пълна сигурност. В статистиката твърдението за 95% увереност просто означава, че изследователят е видял един възможен интервал от голям брой възможни, от които деветнадесет от двадесет интервала съдържат истинската стойност на параметъра.
Практически пример
Машината пълни чаши с маргарин. За примера машината е настроена така, че съдържанието на чашките да е 250 г маргарин. Тъй като машината не може да напълни всяка чаша с точно 250 g, съдържанието, добавено в отделните чаши, показва известно вариране и се счита за случайна величина X. Приема се, че това вариране е нормално разпределено около желаната средна стойност от 250 g със стандартно отклонение от 2,5 g. За да се определи дали машината е адекватно калибрирана, произволно се избира извадка от n = 25 чаши с маргарин и чашите се претеглят. Теглата на маргарина са X1, ..., X25, случайна извадка от X.
За да се добие представа за очакването μ, е достатъчно да се даде оценка. Подходящата оценка е средната стойност на извадката:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. }
В извадката са показани действителните тегла x1, ...,x25 със средна стойност:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 грама . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250,2\,{\text{grams}}. }
Ако вземем друга извадка от 25 чаши, лесно можем да очакваме да открием стойности като 250,4 или 251,1 грама. Средна стойност на извадката от 280 грама обаче би била изключително рядка, ако средното съдържание на чашите всъщност е близко до 250 грама. Около наблюдаваната стойност 250,2 на средната стойност на извадката има цял интервал, в който, ако средната стойност на цялата популация действително приеме стойност в този интервал, наблюдаваните данни не биха се считали за особено необичайни. Такъв интервал се нарича доверителен интервал за параметъра μ. Как се изчислява такъв интервал? Крайните точки на интервала трябва да се изчислят от извадката, така че те са статистически данни, функции на извадката X1, ..., X25 и следователно самите те са случайни величини.
В нашия случай можем да определим крайните точки, като вземем предвид, че средната стойност на извадката X от нормално разпределена извадка също е нормално разпределена, със същото очакване μ, но със стандартна грешка σ/√n = 0,5 (грама). Чрез стандартизиране получаваме случайна променлива
Z = X¯ - μ σ / n = X¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}
зависи от параметъра μ, който трябва да бъде оценен, но със стандартно нормално разпределение, независимо от параметъра μ. Следователно е възможно да се намерят числа -z и z, независими от μ, където Z се намира между тях с вероятност 1 - α, мярка за това колко уверени искаме да бъдем. Ние приемаме 1 - α = 0,95. Така че имаме:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}
Числото z следва от кумулативната функция на разпределение:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}}}
и получаваме:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X¯ - 1,96 × 0,5 ≤ μ ≤ X¯ + 1,96 × 0,5 ) = P ( X¯ - 0,98 ≤ μ ≤ X¯ + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\кратна 0,5\права)\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\права).\end{aligned}}
Това може да се тълкува по следния начин: с вероятност 0,95 ще намерим доверителен интервал, в който ще срещнем параметъра μ между стохастичните крайни точки
X¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,}
и
X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,}
Това не означава, че има вероятност параметърът μ да се срещне в изчисления интервал с вероятност 0,95. Всеки път, когато измерванията се повтарят, ще има друга стойност за средната стойност X на извадката. В 95 % от случаите μ ще бъде между крайните точки, изчислени от тази средна стойност, но в 5 % от случаите няма да е така. Действителният доверителен интервал се изчислява чрез въвеждане на измерените тегла във формулата. Нашият доверителен интервал от 0,95 става:
( x¯ - 0,98 ; x¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
Тъй като желаната стойност 250 на μ е в рамките на получения доверителен интервал, няма причина да се смята, че машината е неправилно калибрирана.
Изчисленият интервал има фиксирани крайни точки, като μ може да се намира между тях (или не). Следователно това събитие има вероятност 0 или 1. Не можем да кажем: "с вероятност (1 - α) параметърът μ лежи в доверителния интервал." Знаем само, че при повторение в 100(1 - α) % от случаите μ ще се намира в изчисления интервал. В 100α % от случаите обаче това не е така. И за съжаление не знаем в кои от случаите се случва това. Ето защо казваме: "при ниво на доверителност 100(1 - α) % μ се намира в доверителния интервал. "
На фигурата вдясно са показани 50 реализации на доверителен интервал за дадена средна стойност на популацията μ. Ако изберем произволно една реализация, вероятността да изберем интервал, който съдържа параметъра, е 95 %; може обаче да нямаме късмет и да сме избрали грешната реализация. Никога няма да разберем; ние сме останали с нашия интервал.
Вертикалните линейни сегменти представляват 50 реализации на доверителния интервал за μ.
Въпроси и отговори
В: Какво представлява доверителният интервал в статистиката?
О: Доверителен интервал е специален интервал, използван за оценка на параметър, като например средната стойност на популацията, като вместо една стойност се дава диапазон от приемливи стойности за параметъра.
В: Защо се използва доверителен интервал вместо една стойност?
О: Доверителен интервал се използва вместо една стойност, за да се отчете несигурността при оценяването на параметър въз основа на извадка и да се даде вероятност реалната стойност на параметъра да е в рамките на интервала.
В: Какво е доверително ниво?
О: Доверителното ниво е вероятността оценяваният параметър да е в рамките на доверителния интервал и често се дава в проценти (напр. 95 % доверителен интервал).
В: Какво представляват доверителните граници?
О: Доверителните граници са крайните точки на доверителния интервал, които определят диапазона на приемливите стойности за оценявания параметър.
В: Как нивото на доверителност влияе на доверителния интервал?
О.: При дадена процедура за оценяване колкото по-високо е доверителното ниво, толкова по-широк е доверителният интервал.
В: Какви предположения са необходими за изчисляване на доверителния интервал?
О.: Изчисляването на доверителния интервал обикновено изисква предположения за естеството на процеса на оценяване, като например предположението, че разпределението на популацията, от която идва извадката, е нормално.
В: Доверителните интервали надеждна статистика ли са?
О.: Както е разгледано по-долу, доверителните интервали не са надеждна статистика, въпреки че могат да се направят корекции, за да се добави надеждност.