Нормално (Гаусово) разпределение — определение, свойства и примери
Нормално (Гаусово) разпределение — ясно обяснение, свойства, графика „камбана“, стандартно Z-разпределение, практични примери и връзка с централната гранична теорема.
Нормалното разпределение е вероятностно разпределение. Нарича се още Гаусово разпределение, защото е открито от Карл Фридрих Гаус. Нормалното разпределение е непрекъснато разпределение на вероятностите и е едно от най-важните разпределения в статистиката и приложните науки. То представлява семейство от разпределения с една и съща обща форма (симетрична „камбановидна“ крива), които се различават по своите параметри на местоположението и мащаба: средната стойност (μ, наричана „средна“) определя центъра на разпределението, а стандартното отклонение (σ — мярка за разсейване; дисперсия е σ²) определя ширината или мащаба му.
Стандартното нормално разпределение (известно още като разпределение Z) е нормалното разпределение със средна стойност нула и дисперсия единица (т.е. σ = 1 и μ = 0). Графиката на плътността на това разпределение често се нарича крива на камбаната, защото формата ѝ наподобява камбана.
Формула и функции
Плътността на вероятността (PDF) на нормалното разпределение с параметри μ и σ е дадена с формулата:
f(x) = 1 / (σ √(2π)) · exp(− (x − μ)² / (2 σ²)), за x ∈ ℝ.
Кумулативната функция на разпределение (CDF) Φ(x) = P(X ≤ x) няма проста затворена форма с елементарни функции; за нея се използват таблични стойности, числени методи или специалната функция на Гаус (erf).
Основни свойства
- Симетрия: Нормалното разпределение е симетрично спрямо средната μ. Следователно медианата и модата съвпадат със средната: mean = median = mode = μ.
- Инфлекционни точки: Кривата има точки на промяна на изпъкналостта при x = μ ± σ.
- Емпирично правило (правило 68–95–99.7): Приблизително 68% от наблюденията лежат в интервала μ ± σ, около 95% в μ ± 2σ и около 99.7% в μ ± 3σ.
- Линейни трансформации: Ако X ~ N(μ, σ²) и Y = aX + b (a ≠ 0), то Y ~ N(aμ + b, a²σ²). По специален случай, стандартизацията Z = (X − μ) / σ води до стандартното нормално разпределение Z ~ N(0,1).
- Сума от независими нормални променливи: Ако X₁ ~ N(μ₁, σ₁²) и X₂ ~ N(μ₂, σ₂²) са независими, то X₁ + X₂ ~ N(μ₁ + μ₂, σ₁² + σ₂²). Това важи за всяка сумарна линейна комбинация на независими нормални променливи.
- Моменти и генериращи функции: Очакването е μ, дисперсията σ². Моментно-генериращата функция е M(t) = exp(μ t + ½ σ² t²).
Стандартизация и използване на Z-таблици
За да се изчисляват вероятности при общо нормално разпределение, обикновено се стандартизира: Z = (X − μ) / σ. След това се използват таблици за стандартното нормално разпределение (Z-таблици) или числени функции, за да се намери P(X ≤ x) = P(Z ≤ z).
Пример: Ако X ~ N(100, 15²), вероятността X ≤ 115 се намира чрез z = (115 − 100)/15 = 1.0, следователно P(X ≤ 115) = Φ(1.0) ≈ 0.8413 (ок. 84.13%).
Причини за честа поява в практиката
Много природни и социални явления имат разпределение, което е приблизително нормално. Това се дължи най-вече на централната гранична теорема: сумата (или средната) на голям брой независими случайни величини с краен втори момент (дори ако самите те не са нормални) се приближава към нормално разпределение при нарастване на броя на членовете. Затова следните величини често са близки до нормални:
- Височини и тегла на хората в популации (при условие на хомогенност по възраст/пол).
- Измервателни грешки в експерименти и технически измервания.
- Резултати от тестове и оценките в стандартизирани изпити (понякога след центриране и скалиране).
- IQ резултати (по дизайн често се моделират като приблизително нормални).
Ограничения и забележки
- Истинските данни може да имат тежки опашки (outliers) или асиметрия; в такива случаи нормалният модел не е подходящ и трябва да се обмислят алтернативи (студентова t, лог-нормално, експоненциално и др.).
- Дисперсията е σ² — важно е да се различава от стандартното отклонение σ; често в литературата се среща объркване между термини.
- При малки размери на извадката апроксимациите, основани на нормалност, могат да бъдат неточни.
Къде се използва практически
- Статистически тестове и доверителни интервали (особено когато се знае или приблизително се приема нормалност).
- Контрол на качеството и управление на процеси (контролни графики, Six Sigma).
- Моделиране на грешки в измервания и оценка на несигурността.
- Финансова математика — при някои нагледни модели за лог-доходи и грешки в оценки (с внимание към тежките опашки в реалните данни).
Нормалното разпределение е както теоретично важно (поради своята аналитична удобност и връзката с централната гранична теорема), така и изключително полезно при практическа работа с данни — стига да се внимава за допусканията и ограниченията при прилагането му.
Въпроси и отговори
В: Какво представлява нормалното разпределение?
О: Нормалното разпределение е вероятностно разпределение, което е много важно в много области на науката.
В: Кой е открил нормалното разпределение?
О: Нормалното разпределение е открито за първи път от Карл Фридрих Гаус.
В: Какво представляват параметрите на местоположението и мащаба в нормалните разпределения?
О: Средната стойност ("средната") на разпределението определя неговото местоположение, а стандартното отклонение ("вариацията") определя мащаба на нормалните разпределения.
В: Как се представят параметрите на местоположението и мащаба на нормалните разпределения?
О: Средната стойност и стандартното отклонение на нормалните разпределения се представят съответно със символите μ и σ.
В: Какво представлява стандартното нормално разпределение?
О: Стандартното нормално разпределение (известно още като разпределение Z) е нормалното разпределение със средна стойност нула и стандартно отклонение единица.
В: Защо стандартното нормално разпределение често се нарича крива на камбаната?
О: Стандартното нормално разпределение често се нарича крива на камбаната, защото графиката на неговата плътност на вероятността прилича на камбана.
В: Защо много стойности следват нормалното разпределение?
О: Много стойности следват нормалното разпределение поради централната гранична теорема, която казва, че ако едно събитие е сума от идентични, но случайни събития, то ще бъде нормално разпределено.
обискирам
