Стандартна грешка

Стандартната грешка е стандартното отклонение на разпределението на извадката за дадена статистика. Терминът може да се използва и за оценка (добро предположение) на това стандартно отклонение, взета от извадка на цялата група.

Средната стойност на някаква част от група (наречена извадка) е обичайният начин за оценка на средната стойност за цялата група. Често е твърде трудно или струва твърде скъпо да се измери цялата група. Но ако се измери друга извадка, тя ще има средна стойност, която е малко по-различна от тази на първата извадка. Стандартната грешка на средната стойност е начин да се разбере колко близо е средната стойност на извадката до средната стойност на цялата група. Това е начин да се разбере доколко можете да бъдете сигурни за средната стойност от извадката.

При реални измервания истинската стойност на стандартното отклонение на средната стойност за цялата група обикновено не е известна. Затова терминът "стандартна грешка" често се използва за означаване на близко предположение за истинското число за цялата група. Колкото повече измервания има в извадката, толкова по-близко ще бъде предположението до истинското число за цялата група.

За стойност, която е избрана с неизкривена нормално разпределена грешка, горното показва дела на извадките, които биха попаднали между 0, 1, 2 и 3 стандартни отклонения над и под действителната стойност.Zoom
За стойност, която е избрана с неизкривена нормално разпределена грешка, горното показва дела на извадките, които биха попаднали между 0, 1, 2 и 3 стандартни отклонения над и под действителната стойност.

Как да намерим стандартната грешка на средната стойност

Един от начините за намиране на стандартната грешка на средната стойност е да се направят много извадки. Първо се намира средната стойност за всяка извадка. След това се намират средната стойност и стандартното отклонение на тези средни стойности за извадките. Стандартното отклонение за всички средни стойности на извадките е стандартната грешка на средната стойност. Това може да е много работа. Понякога е твърде трудно или струва твърде много пари да се направят много извадки.

Друг начин за намиране на стандартната грешка на средната стойност е да се използва уравнение, което се нуждае само от една извадка. Стандартната грешка на средната стойност обикновено се изчислява чрез стандартното отклонение за извадка от цялата група (стандартно отклонение на извадката), разделено на квадратния корен от размера на извадката.

S E x¯ = s n {\displaystyle SE_{\bar {x}} ={\frac {s}{\sqrt {n}}}} {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

където

s е стандартното отклонение на извадката (т.е. базирана на извадката оценка на стандартното отклонение на популацията), и

n е броят на измерванията в извадката.

Колко голяма трябва да е извадката, за да може оценката на стандартната грешка на средната стойност да е близка до действителната стандартна грешка на средната стойност за цялата група? В извадката трябва да има поне шест измервания. Тогава стандартната грешка на средната стойност за извадката ще бъде в рамките на 5 % от стандартната грешка на средната стойност, ако е била измерена цялата група.

Поправки за някои случаи

Има и друго уравнение, което трябва да се използва, ако броят на измерванията е 5% или повече от цялата група:

Има специални уравнения, които се използват, ако пробата има по-малко от 20 измервания.

Понякога извадката идва от едно място, въпреки че цялата група може да е разпръсната. Също така понякога една извадка може да бъде направена за кратък период от време, докато цялата група обхваща по-дълъг период от време. В този случай числата в извадката не са независими. Тогава се използват специални уравнения, които се опитват да коригират това.

Полезност

Практически резултат: Човек може да стане по-сигурен в средната стойност, ако има повече измервания в извадката. Тогава стандартната грешка на средната стойност ще бъде по-малка, тъй като стандартното отклонение е разделено на по-голямо число. Въпреки това, за да бъде несигурността (стандартната грешка на средната стойност) на една средна стойност наполовина по-малка, размерът на извадката (n) трябва да бъде четири пъти по-голям. Това е така, защото стандартното отклонение се разделя на квадратния корен от размера на извадката. За да бъде несигурността една десета по-голяма, размерът на извадката (n) трябва да бъде сто пъти по-голям!

Стандартните грешки са лесни за изчисляване и се използват често, защото:

  • Ако стандартната грешка на няколко отделни величини е известна, то стандартната грешка на някаква функция на величините може лесно да се изчисли в много случаи;
  • Когато вероятностното разпределение на стойността е известно, то може да се използва за изчисляване на добро приближение до точен доверителен интервал; и
  • Когато вероятностното разпределение не е известно, могат да се използват други уравнения, за да се оцени доверителният интервал.
  • Когато размерът на извадката стане много голям, принципът на централната гранична теорема показва, че числата в извадката много приличат на числата в цялата група (те имат нормално разпределение).

Относителна стандартна грешка

Относителната стандартна грешка (RSE) е стандартната грешка, разделена на средната стойност. Това число е по-малко от единица. Ако го умножите по 100%, ще го получите като процент от средната стойност. Това помага да се покаже дали неопределеността е важна или не. Например, разгледайте две проучвания на доходите на домакинствата, които водят до средна стойност на извадката от 50 000 USD. Ако при едното проучване стандартната грешка е 10 000 USD, а при другото - 5 000 USD, тогава относителните стандартни грешки са съответно 20 % и 10 %. Изследването с по-ниска относителна стандартна грешка е по-добро, защото има по-точно измерване (несигурността е по-малка).

Всъщност хората, които трябва да знаят средните стойности, често решават колко малка трябва да бъде неопределеността, преди да решат да използват информацията. Например Националният център за здравна статистика на САЩ не съобщава средна стойност, ако относителната стандартна грешка надхвърля 30 %. NCHS също така изисква поне 30 наблюдения, за да бъде отчетена дадена оценка. []

Пример

Например във водите на Мексиканския залив има много червени риби. За да разберете колко средно тежи един червеноперка с дължина 42 cm, не е възможно да измерите всички червеноперки с дължина 42 cm. Вместо това е възможно да се измерят някои от тях. Рибите, които действително са измерени, се наричат извадка. В таблицата са показани теглата на две извадки от морски костури, всички с дължина 42 cm. Средното тегло на първата проба е 0,741 kg. Средното тегло на втората проба е 0,735 kg, което е малко по-различно от теглото на първата проба. Всяка от тези средни стойности е малко по-различна от средната стойност, която би се получила от измерването на всеки червеноперка с дължина 42 cm (което така или иначе не е възможно).

Несигурността на средната стойност може да се използва, за да се разбере колко близо е средната стойност на извадките до средната стойност, която би се получила при измерване на цялата група. Неопределеността на средната стойност се изчислява като стандартното отклонение за извадката, разделено на квадратния корен от броя на извадките минус едно. Таблицата показва, че неопределеността на средните стойности за двете извадки е много близка една до друга. Също така относителната неопределеност е неопределеността на средната стойност, разделена на средната стойност, умножена по 100 %. Относителната неопределеност в този пример е 2,38 % и 2,50 % за двете проби.

Познавайки несигурността на средната стойност, може да се разбере колко близо е средната стойност на извадката до средната стойност, която би се получила при измерване на цялата група. Средната стойност за цялата група е между: а) средната стойност за извадката плюс неопределеността на средната стойност и б) средната стойност за извадката минус неопределеността на средната стойност. В този пример средното тегло на всички 42-сантиметрови морски костури в Мексиканския залив се очаква да бъде 0,723-0,759 kg въз основа на първата проба и 0,717-0,753 въз основа на втората проба.

Zoom


Пример за червеноперка (известна също като червен барабан, Sciaenops ocellatus), използвана в примера.Zoom
Пример за червеноперка (известна също като червен барабан, Sciaenops ocellatus), използвана в примера.

Въпроси и отговори

В: Какво представлява стандартната грешка?


О: Стандартната грешка е стандартното отклонение на разпределението на извадката на дадена статистика.

В: Може ли терминът "стандартна грешка" да се използва за оценка на стандартното отклонение?


О: Да, терминът стандартна грешка може да се използва за оценка (добро предположение) на това стандартно отклонение, взето от извадка на цялата група.

В: Как се оценява средната стойност за цялата група?


О: Средната стойност на някаква част от групата (наречена извадка) е обичайният начин да се оцени средната стойност за цялата група.

В: Защо е трудно да се измери цялата група?


О: Често е твърде трудно или твърде скъпо да се измери цялата група.

В: Какво е стандартна грешка на средната стойност и какво определя тя?


О: Стандартната грешка на средната стойност е начин да се разбере колко близо е средната стойност на извадката до средната стойност на цялата група. Това е начин да се разбере колко сигурен може да бъде човек за средната стойност от извадката.

Въпрос: Обикновено ли е известна истинската стойност на стандартното отклонение на средната стойност при реални измервания?


О: Не, истинската стойност на стандартното отклонение на средната стойност за цялата група обикновено не е известна при реални измервания.

В: Как броят на измерванията в извадката влияе върху точността на оценката?


О: Колкото повече измервания има в извадката, толкова по-близко ще бъде предположението до истинското число за цялата група.

AlegsaOnline.com - 2020 / 2023 - License CC3