Стандартното отклонение е число, което се използва, за да покаже как измерванията на дадена група се отклоняват от средната стойност (средната или очакваната стойност). Ниското стандартно отклонение означава, че повечето числа са близки до средната стойност, докато високото стандартно отклонение означава, че числата са по-разпръснати.

Отчетената грешка обикновено е два пъти по-голяма от стандартното отклонение. Учените обикновено съобщават стандартното отклонение на числата от средното число при експерименти. Те често решават, че само разликите, по-големи от два или три пъти стандартното отклонение, са важни. Стандартното отклонение е полезно и при парите, където стандартното отклонение на спечелената лихва показва колко различна може да бъде спечелената лихва на един човек от средната.

В много случаи може да се измери само извадка или част от група. Тогава число, близко до стандартното отклонение за цялата група, може да се намери чрез малко по-различно уравнение, наречено стандартно отклонение на извадката, обяснено по-долу. В този случай стандартното отклонение на цялата група се представя с гръцката буква {\displaystyle \sigma }, а това на извадката - с {\displaystyle s} .




 

Какво представлява числено и връзка с дисперсията

Стандартното отклонение измерва средното разстояние на наблюденията от тяхната средна стойност. То е квадратният корен от дисперсията. Ако дисперсията (variance) е показател за средната на квадратите на отклоненията, то стандартното отклонение връща стойността в същите единици като оригиналните данни, което я прави по-интуитивна.

Формули

  • За цяла популация (когато имате данните за всички елементи): σ = sqrt( (Σ (xi − μ)^2) / N ), където μ е средната на популацията и N е броят на елементите.
  • За извадка (когато имате само част от цялата популация): s = sqrt( (Σ (xi − x̄)^2) / (n − 1) ), където x̄ е средната на извадката и n е размерът на извадката. Делението на (n − 1) вместо n се нарича Besselова корекция и дава несмещена оценка на дисперсията на популацията.

Пример стъпка по стъпка

Данни: 2, 4, 4, 4, 5, 5, 7, 9

  • Средна (μ или x̄) = (2+4+4+4+5+5+7+9)/8 = 40/8 = 5
  • Отклонения от средната: −3, −1, −1, −1, 0, 0, 2, 4
  • Квадрати на отклоненията: 9, 1, 1, 1, 0, 0, 4, 16 → сума = 32
  • Дисперсия на популацията = 32/8 = 4 → σ = sqrt(4) = 2
  • Дисперсия на извадката = 32/(8−1) = 32/7 ≈ 4.571 → s ≈ sqrt(4.571) ≈ 2.138

Интерпретация и полезни правила

  • Малко стандартно отклонение → наблюденията са стегнати около средната стойност. Голямо стандартно отклонение → данните са по-разпръснати.
  • Емпирично правило за нормално разпределение (приблизително): 68% от стойностите попадат в интервала μ ± σ, 95% в μ ± 2σ и 99.7% в μ ± 3σ. Това важи най-добре при близко до нормално разпределение.
  • Стандартното отклонение има същите единици като наблюденията (например метри, левове, секунди), за разлика от дисперсията, която е в квадратни единици.

Кога да използваме стандартното отклонение и ограничения

  • Подходящо за симетрични, приблизително нормални разпределения.
  • Чувствително към екстремни стойности (outliers) — няколко крайни наблюдения могат значително да увеличат стандартното отклонение.
  • При силно наклонени разпределения често е по-информативно да се използва межквартилният размах (IQR) или медианната абсолютна девиация (MAD), които са по-робустни към аномалии.

Практически приложения

  • В експериментални науки за оценка на точността и прецизността на измервания.
  • В финансите за измерване на волатилността на доходността на активи (с по-голямо стандартно отклонение → по-голям риск/волатилност).
  • В качествения контрол и при аналитични методи за откриване на значими отклонения от очакваните стойности.

Съвети при отчитане

  • Ясно посочвайте дали давате стандартно отклонение на популация (σ) или на извадка (s).
  • Когато съобщавате средна стойност, често е полезно да дадете и стандартното отклонение (напр. 5.0 ± 2.1), за да описвате разсейването на данните.
  • При малки извадки интерпретацията трябва да е по-предпазлива — оценките на дисперсия и стандартно отклонение са по-неточни.

Обобщено, стандартното отклонение е основен статистически показател за вариабилността на данните. Разбирането кога и как да се използва, както и неговите ограничения, помага при правилния анализ и интерпретация на резултатите.