Стандартно отклонение | число, което се използва, за да покаже как измерванията на дадена група се различават от средната стойност

Стандартното отклонение е число, което се използва, за да покаже как измерванията на дадена група се отклоняват от средната стойност (средната или очакваната стойност). Ниското стандартно отклонение означава, че повечето числа са близки до средната стойност, докато високото стандартно отклонение означава, че числата са по-разпръснати.

Отчетената грешка обикновено е два пъти по-голяма от стандартното отклонение. Учените обикновено съобщават стандартното отклонение на числата от средното число при експерименти. Те често решават, че само разликите, по-големи от два или три пъти стандартното отклонение, са важни. Стандартното отклонение е полезно и при парите, където стандартното отклонение на спечелената лихва показва колко различна може да бъде спечелената лихва на един човек от средната.

В много случаи може да се измери само извадка или част от група. Тогава число, близко до стандартното отклонение за цялата група, може да се намери чрез малко по-различно уравнение, наречено стандартно отклонение на извадката, обяснено по-долу. В този случай стандартното отклонение на цялата група се представя с гръцката буква {\displaystyle \sigma }, а това на извадката - с {\displaystyle s} .




  Пример за две извадкови популации с еднаква средна стойност и различни стандартни отклонения. Червената популация има средна стойност 100 и SD 10; синята популация има средна стойност 100 и SD 50.  Zoom
Пример за две извадкови популации с еднаква средна стойност и различни стандартни отклонения. Червената популация има средна стойност 100 и SD 10; синята популация има средна стойност 100 и SD 50.  

Диаграма на нормално разпределение (или крива на камбаната). Всяка цветна ивица има ширина едно стандартно отклонение.  Zoom
Диаграма на нормално разпределение (или крива на камбаната). Всяка цветна ивица има ширина едно стандартно отклонение.  

Набор от данни със средна стойност 50 (показана в синьо) и стандартно отклонение (σ) 20.  Zoom
Набор от данни със средна стойност 50 (показана в синьо) и стандартно отклонение (σ) 20.  

Основен пример

Разгледайте група със следните осем числа:

{\displaystyle 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9}

Средната стойност на тези осем числа е 5:

{\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5}

За да изчислите стандартното отклонение на популацията, първо намерете разликата на всяко число в списъка от средната стойност. След това изравнете резултата от всяка разлика с квадрат:

{\displaystyle {\begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\\\end{array}}}

След това намерете средната стойност на тези стойности (сумата, разделена на броя на числата). Накрая вземете квадратния корен:

{\displaystyle {\sqrt {\frac {(9+1+1+1+0+0+4+16)}{8}}}=2}

Отговорът е стандартното отклонение на популацията. Формулата е вярна само ако осемте числа, с които започнахме, са цялата група. Ако те са само част от групата, избрана на случаен принцип, тогава можем да получим обективна оценка на стандартното отклонение на популацията, като разделим на 7 (което е n - 1) вместо на 8 (което е n) в долната част (знаменателя) на горната формула. Тогава отговорът е стандартното отклонение на извадката (коригирано с отклонението). Това се нарича корекция на Бесел. Често използваме тази корекция, защото извадковата дисперсия, т.е. квадратът на извадковото стандартно отклонение, е безпристрастна оценка на популационната дисперсия, с други думи, очакваната стойност или дългосрочната средна стойност на извадковата дисперсия е равна на популационната (истинската) дисперсия. Въпреки че поправката на Бесел е безпристрастна оценка на дисперсията, тази оценка има по-висока средна квадратична грешка от предубедената оценка, или с други думи, предубедената оценка (т.е. разделянето на n, а не на n-1) е средно по-близка до истинската стойност.


 

Още примери

Ето един малко по-труден пример от реалния живот: Средният ръст на възрастните мъже в САЩ е 70" със стандартно отклонение от 3". Стандартно отклонение от 3" означава, че повечето мъже (около 68%, ако приемем, че разпределението е нормално) имат ръст от 3" по-висок до 3" по-нисък от средния (67"-73") - едно стандартно отклонение. Почти всички мъже (около 95%) имат ръст от 6" по-висок до 6" по-нисък от средния (64"-76") - две стандартни отклонения. Три стандартни отклонения включват всички числа за 99,7% от изследваната извадка. Това е вярно, ако разпределението е нормално (камбановидно).

Ако стандартното отклонение беше нула, всички мъже щяха да са високи точно 70". Ако стандартното отклонение е 20", тогава някои мъже ще бъдат много по-високи или много по-ниски от средното, като типичният диапазон е около 50-90".

Друг пример: всяка от трите групи {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} има средна стойност (mean) 7. Но техните стандартни отклонения са 7, 5 и 1. Третата група има много по-малко стандартно отклонение от другите две, защото всички числа в нея са близки до 7. По принцип стандартното отклонение ни казва колко далеч от средната стойност са останалите числа и то ще има същите единици като самите числа. Например, ако групата {0, 6, 8, 14} е възрастта на група от четирима братя в години, средната стойност е 7 години, а стандартното отклонение е 5 години.

Стандартното отклонение може да служи като мярка за неопределеност. В науката например стандартното отклонение на група повтарящи се измервания помага на учените да разберат доколко са сигурни за средното число. Когато се решава дали измерванията от даден експеримент съвпадат с дадена прогноза, стандартното отклонение на тези измервания е много важно. Ако средното число от експериментите е твърде далеч от предсказаното число (като разстоянието се измерва в стандартни отклонения), тогава проверяваната теория може да не е правилна. За повече информация вижте интервал на прогнозиране.

Примери за приложение

Разбирането на стандартното отклонение на даден набор от стойности ни позволява да разберем колко голяма разлика от "средната стойност" се очаква.

Времето

Като прост пример, разгледайте средните дневни високи температури за два града - един във вътрешността на страната и един близо до океана. Полезно е да се разбере, че диапазонът на дневните високи температури за градовете в близост до океана е по-малък, отколкото за градовете във вътрешността на страната. Всеки от тези два града може да има една и съща средна дневна висока температура. Въпреки това стандартното отклонение на високата дневна температура за крайбрежния град ще бъде по-малко от това на града във вътрешността на страната .

Спорт

Друг начин за разглеждане на този проблем е да разгледаме спортните отбори. Във всеки спорт има отбори, които са добри в някои неща и не са добри в други. Отборите, които са класирани най-високо, няма да показват големи разлики в способностите си. Те се справят добре в повечето категории. Колкото по-ниско е стандартното отклонение на способностите им във всяка категория, толкова по-балансирани и последователни са те. Отборите с по-високо стандартно отклонение обаче ще бъдат по-малко предсказуеми. Отбор, който обикновено е лош в повечето категории, ще има ниско стандартно отклонение. Отбор, който обикновено е добър в повечето категории, също ще има ниско стандартно отклонение. Въпреки това отбор с високо стандартно отклонение може да бъде от типа отбори, които вкарват много точки (силно нападение), но също така позволяват на другия отбор да вкара много точки (слаба защита).

Опитът да се разбере предварително кои отбори ще спечелят може да включва разглеждане на стандартните отклонения на различните "статистики" на отборите. Числата, които се различават от очакваните, могат да се съпоставят със силните и слабите страни, за да се покаже кои причини могат да бъдат най-важни, за да се разбере кой отбор ще спечели.

В състезанията се измерва времето, за което пилотът завършва всяка обиколка на пистата. Пилот с ниско стандартно отклонение на времето за обиколка е по-постоянен от пилот с по-високо стандартно отклонение. Тази информация може да се използва, за да се разбере как водачът може да намали времето за завършване на обиколка.

Пари

В паричната сфера стандартното отклонение може да означава риска от повишаване или понижаване на цената (акции, облигации, имоти и др.). То може да означава и риска, че група цени ще се повишат или понижат (активно управлявани взаимни фондове, индексни взаимни фондове или ETF). Рискът е една от причините да се вземат решения за това какво да се купува. Рискът е число, което хората могат да използват, за да разберат колко пари могат да спечелят или да загубят. Когато рискът става по-голям, възвръщаемостта от дадена инвестиция може да бъде по-голяма от очакваната ("плюс" стандартно отклонение). Една инвестиция обаче може и да загуби повече пари от очакваното ("минус" стандартно отклонение).

Например, човек трябва да избере между две акции. Акция А за последните 20 години има средна възвръщаемост от 10% със стандартно отклонение от 20 процентни пункта (пп). Акция Б за последните 20 години има средна възвръщаемост от 12%, но по-високо стандартно отклонение от 30 пр.п. Обмисляйки риска, лицето може да реши, че акция А е по-сигурният избор. Въпреки че може да не спечели толкова много пари, вероятно няма и да загуби много пари. Лицето може да реши, че по-високата с 2 пункта средна стойност на акция Б не си заслужава допълнителното стандартно отклонение от 10 pp (по-голям риск или несигурност на очакваната възвръщаемост).

Правила за нормално разпределени числа

Повечето математически уравнения за стандартно отклонение предполагат, че числата са нормално разпределени. Това означава, че числата са разпределени по определен начин от двете страни на средната стойност. Нормалното разпределение се нарича още Гаусово разпределение, защото е открито от Карл Фридрих Гаус. Често се нарича крива на камбаната, защото числата се разпределят така, че на графиката имат формата на камбана.

Числата не са нормално разпределени, ако са групирани от едната или от другата страна на средната стойност. Числата могат да бъдат разпределени и пак да са нормално разпределени. Стандартното отклонение показва колко широко са разпределени числата.



 Тъмносиньото е по-малко от едно стандартно отклонение от средната стойност. За нормалното разпределение това включва 68,27% от числата; докато две стандартни отклонения от средната стойност (средно и тъмно синьо) включват 95,45%; три стандартни отклонения (светло, средно и тъмно синьо) включват 99,73%; а четири стандартни отклонения - 99,994%.  Zoom
Тъмносиньото е по-малко от едно стандартно отклонение от средната стойност. За нормалното разпределение това включва 68,27% от числата; докато две стандартни отклонения от средната стойност (средно и тъмно синьо) включват 95,45%; три стандартни отклонения (светло, средно и тъмно синьо) включват 99,73%; а четири стандартни отклонения - 99,994%.  

Връзка между средната стойност и стандартното отклонение

Средната стойност и стандартното отклонение на даден набор от данни обикновено се записват заедно. Тогава човек може да разбере какво е средното число и колко широко са разпределени другите числа в групата.

Начинът, по който е разпределена дадена група числа, може да бъде представен и чрез коефициента на вариация (CV), който представлява стандартното отклонение, разделено на средната стойност. Това е безразмерно число. Коефициентът на вариация често се умножава по 100% и се записва като процент.


 

История

Терминът "стандартно отклонение" е използван за първи път писмено от Карл Пирсън през 1894 г., след като той го използва в лекции. Той замества по-ранни наименования на същата идея: например Гаус използва средна грешка.


 

Свързани страници



 

Въпроси и отговори

В: Какво представлява стандартното отклонение?


О: Стандартното отклонение е число, което се използва, за да покаже как измерванията за дадена група са разпръснати от средната стойност (средната или очакваната стойност).

В: Какво означава ниско стандартно отклонение?


О: Ниското стандартно отклонение означава, че повечето числа са близки до средната стойност.

В: Какво означава високо стандартно отклонение?


О: Високото стандартно отклонение означава, че числата са по-разпръснати.

Въпрос: Как се използва стандартното отклонение в парите?


О: В парите стандартното отклонение на спечелената лихва показва колко различна може да бъде спечелената лихва на един човек от средната.

В: Кога може да се измери само част от група?


О: В много случаи може да се измери само извадка или част от група.

В: Как се представя стандартното отклонение на цялата група?


О: Стандартното отклонение на цялата група се представя с гръцката буква َ {\displaystyle \sigma } .

В: Как се представя стандартното отклонение на извадката?


О: Стандартното отклонение на извадката се представя с s {\displaystyle s} .

AlegsaOnline.com - 2020 / 2023 - License CC3