Нормално (Гаусово) разпределение — определение, свойства и примери

Нормално (Гаусово) разпределение — ясно обяснение, свойства, графика „камбана“, стандартно Z-разпределение, практични примери и връзка с централната гранична теорема.

Автор: Leandro Alegsa

Нормалното разпределение е вероятностно разпределение. Нарича се още Гаусово разпределение, защото е открито от Карл Фридрих Гаус. Нормалното разпределение е непрекъснато разпределение на вероятностите и е едно от най-важните разпределения в статистиката и приложните науки. То представлява семейство от разпределения с една и съща обща форма (симетрична „камбановидна“ крива), които се различават по своите параметри на местоположението и мащаба: средната стойност (μ, наричана „средна“) определя центъра на разпределението, а стандартното отклонение (σ — мярка за разсейване; дисперсия е σ²) определя ширината или мащаба му.

Стандартното нормално разпределение (известно още като разпределение Z) е нормалното разпределение със средна стойност нула и дисперсия единица (т.е. σ = 1 и μ = 0). Графиката на плътността на това разпределение често се нарича крива на камбаната, защото формата ѝ наподобява камбана.

Формула и функции

Плътността на вероятността (PDF) на нормалното разпределение с параметри μ и σ е дадена с формулата:

f(x) = 1 / (σ √(2π)) · exp(− (x − μ)² / (2 σ²)), за x ∈ ℝ.

Кумулативната функция на разпределение (CDF) Φ(x) = P(X ≤ x) няма проста затворена форма с елементарни функции; за нея се използват таблични стойности, числени методи или специалната функция на Гаус (erf).

Основни свойства

  • Симетрия: Нормалното разпределение е симетрично спрямо средната μ. Следователно медианата и модата съвпадат със средната: mean = median = mode = μ.
  • Инфлекционни точки: Кривата има точки на промяна на изпъкналостта при x = μ ± σ.
  • Емпирично правило (правило 68–95–99.7): Приблизително 68% от наблюденията лежат в интервала μ ± σ, около 95% в μ ± 2σ и около 99.7% в μ ± 3σ.
  • Линейни трансформации: Ако X ~ N(μ, σ²) и Y = aX + b (a ≠ 0), то Y ~ N(aμ + b, a²σ²). По специален случай, стандартизацията Z = (X − μ) / σ води до стандартното нормално разпределение Z ~ N(0,1).
  • Сума от независими нормални променливи: Ако X₁ ~ N(μ₁, σ₁²) и X₂ ~ N(μ₂, σ₂²) са независими, то X₁ + X₂ ~ N(μ₁ + μ₂, σ₁² + σ₂²). Това важи за всяка сумарна линейна комбинация на независими нормални променливи.
  • Моменти и генериращи функции: Очакването е μ, дисперсията σ². Моментно-генериращата функция е M(t) = exp(μ t + ½ σ² t²).

Стандартизация и използване на Z-таблици

За да се изчисляват вероятности при общо нормално разпределение, обикновено се стандартизира: Z = (X − μ) / σ. След това се използват таблици за стандартното нормално разпределение (Z-таблици) или числени функции, за да се намери P(X ≤ x) = P(Z ≤ z).

Пример: Ако X ~ N(100, 15²), вероятността X ≤ 115 се намира чрез z = (115 − 100)/15 = 1.0, следователно P(X ≤ 115) = Φ(1.0) ≈ 0.8413 (ок. 84.13%).

Причини за честа поява в практиката

Много природни и социални явления имат разпределение, което е приблизително нормално. Това се дължи най-вече на централната гранична теорема: сумата (или средната) на голям брой независими случайни величини с краен втори момент (дори ако самите те не са нормални) се приближава към нормално разпределение при нарастване на броя на членовете. Затова следните величини често са близки до нормални:

  • Височини и тегла на хората в популации (при условие на хомогенност по възраст/пол).
  • Измервателни грешки в експерименти и технически измервания.
  • Резултати от тестове и оценките в стандартизирани изпити (понякога след центриране и скалиране).
  • IQ резултати (по дизайн често се моделират като приблизително нормални).

Ограничения и забележки

  • Истинските данни може да имат тежки опашки (outliers) или асиметрия; в такива случаи нормалният модел не е подходящ и трябва да се обмислят алтернативи (студентова t, лог-нормално, експоненциално и др.).
  • Дисперсията е σ² — важно е да се различава от стандартното отклонение σ; често в литературата се среща объркване между термини.
  • При малки размери на извадката апроксимациите, основани на нормалност, могат да бъдат неточни.

Къде се използва практически

  • Статистически тестове и доверителни интервали (особено когато се знае или приблизително се приема нормалност).
  • Контрол на качеството и управление на процеси (контролни графики, Six Sigma).
  • Моделиране на грешки в измервания и оценка на несигурността.
  • Финансова математика — при някои нагледни модели за лог-доходи и грешки в оценки (с внимание към тежките опашки в реалните данни).

Нормалното разпределение е както теоретично важно (поради своята аналитична удобност и връзката с централната гранична теорема), така и изключително полезно при практическа работа с данни — стига да се внимава за допусканията и ограниченията при прилагането му.

Въпроси и отговори

В: Какво представлява нормалното разпределение?


О: Нормалното разпределение е вероятностно разпределение, което е много важно в много области на науката.

В: Кой е открил нормалното разпределение?


О: Нормалното разпределение е открито за първи път от Карл Фридрих Гаус.

В: Какво представляват параметрите на местоположението и мащаба в нормалните разпределения?


О: Средната стойност ("средната") на разпределението определя неговото местоположение, а стандартното отклонение ("вариацията") определя мащаба на нормалните разпределения.

В: Как се представят параметрите на местоположението и мащаба на нормалните разпределения?


О: Средната стойност и стандартното отклонение на нормалните разпределения се представят съответно със символите μ и σ.

В: Какво представлява стандартното нормално разпределение?


О: Стандартното нормално разпределение (известно още като разпределение Z) е нормалното разпределение със средна стойност нула и стандартно отклонение единица.

В: Защо стандартното нормално разпределение често се нарича крива на камбаната?


О: Стандартното нормално разпределение често се нарича крива на камбаната, защото графиката на неговата плътност на вероятността прилича на камбана.

В: Защо много стойности следват нормалното разпределение?


О: Много стойности следват нормалното разпределение поради централната гранична теорема, която казва, че ако едно събитие е сума от идентични, но случайни събития, то ще бъде нормално разпределено.


обискирам
AlegsaOnline.com - 2020 / 2025 - License CC3