Образец | част от населението

В статистиката извадката е част от дадена популация. Извадката се подбира внимателно. Тя трябва да представя цялата популация справедливо, без пристрастия.

Когато се разглежда като набор от данни, извадката често се представя с главни букви, като {\displaystyle X} и {\displaystyle Y} , като нейните елементи се представят с малки букви (например {\displaystyle x_{3}} ), а размерът на извадката се представя с буквата n .

Причината, поради която са необходими извадки, е, че популациите могат да бъдат толкова големи, че преброяването на всички индивиди да не е възможно или практично. Затова решаването на даден проблем в статистиката обикновено започва с извадка. Извадката е свързана с избора на данни, които да бъдат взети за последващ анализ. Като пример може да се предположи, че за целите на дадено проучване трябва да се анализира замърсяването на езеро. В зависимост от това къде са взети пробите от водата, изследванията могат да имат различни резултати.

Като общо правило извадките трябва да са случайни. Това означава, че шансът или вероятността да се избере едно лице е еднакъв с шанса да се избере всяко друго лице.

На практика случайните извадки винаги се правят чрез точно определена процедура. Процедурата е набор от правила, последователност от стъпки, които се записват и следват точно. Дори и при това положение в извадката може да остане известно отклонение. Да разгледаме проблема с изготвянето на извадка за прогнозиране на резултата от предизборно проучване. Всички известни методи имат своите проблеми и резултатите от изборите често се различават от прогнозите, основани на извадка. Ако събирате мнения чрез използване на телефони или чрез срещи с хора на улицата, няма да попитате хора, които не отговарят на телефонни обаждания или които не ходят по улицата. Затова в подобни случаи никога не е възможно да се получи напълно неутрална извадка. В такива случаи статистикът ще помисли как да измери размера на отклонението и има начини да го оцени.

Подобна е ситуацията, когато учените измерват физично свойство, например теглото на парче метал или скоростта на светлината. Ако претеглим даден обект с чувствително оборудване, ще получим незначително различни резултати. Никоя система за измерване не е съвършена. Получаваме поредица от оценки, като всяка от тях е измерване. Това са извадки с определена степен на грешка. Статистиката е предназначена да описва грешките и да извършва анализ на този вид данни.

Съществуват различни видове проби:

  • Пълната извадка включва всички елементи, които притежават дадено свойство.
  • Безпристрастна или представителна извадка се получава, като се вземе пълна извадка и се подберат елементи от нея в процес, който не зависи от свойствата на елементите.

Начинът на получаване на извадката, както и нейният размер, ще окажат влияние върху начина, по който се разглеждат данните.




  Гранична полиция търси незаконни наркотици със специално обучено куче: Ако проверяват всеки десети автомобил, те вземат безпристрастна проба.  Zoom
Гранична полиция търси незаконни наркотици със специално обучено куче: Ако проверяват всеки десети автомобил, те вземат безпристрастна проба.  

Стратифицирана извадка

Ако популацията има очевидни субпопулации, всяка от субпопулациите трябва да бъде включена в извадка. Това се нарича стратифицирана извадка. Стратифицираната извадка е известна още като стратифицирана случайна извадка. Стратифицираната извадка често се представя като пропорция, например процент (%).

Да предположим, че експериментът е насочен към проучване на доходите на възрастните. Очевидно е, че доходите на завършилите колеж могат да се различават от тези на незавършилите. Сега да предположим, че броят на завършилите висше образование мъже е 30 % от общия брой възрастни мъже (въображаеми цифри). Тогава бихте организирали 30 % от общата извадка да бъдат мъже, завършили висше образование, избрани на случаен принцип, а 70 % от общата извадка да бъдат мъже, които не са завършили висше образование. Повторете процеса за жените, тъй като процентът на завършилите жени е различен от този на мъжете. Така се получава извадка от възрастното население, стратифицирана по пол и висше образование. Следващата стъпка е да разделите всяка от подгрупите по възрастови групи, тъй като (например) завършилите висше образование могат да получат по-голям доход в сравнение с незавършилите висше образование на средна възраст.

Друг тип стратифицирана извадка се занимава с вариациите. В този случай се вземат по-големи извадки от по-променливите субпопулации, така че обобщените статистически данни, като средни стойности и стандартни отклонения, да бъдат по-надеждни.


 

Въпроси и отговори

В: Какво е извадка в статистиката?


О: В статистиката извадката е част от популацията, която е внимателно подбрана, за да представи справедливо и без предубеждения цялата популация.

В: Защо са необходими извадки?


О: Извадките са необходими, защото популациите могат да бъдат толкова големи, че преброяването на всички индивиди да не е възможно или практично. Затова решаването на даден проблем в статистиката обикновено започва с извадка.

В: Как се представя една извадка?


О: Когато се разглежда като набор от данни, извадката често се представя с главни букви, например X и Y, като елементите ѝ се представят с малки букви (например x3), а размерът на извадката се представя с буквата n.

В: Какви трябва да бъдат извадките?


О: Като общо правило извадките трябва да бъдат случайни, което означава, че шансът или вероятността да се избере едно лице е еднакъв с шанса да се избере всяко друго лице. В практиката случайните извадки винаги се правят чрез точно определена процедура.

Въпрос: Може ли в извадките да остане отклонение?


О: Дори когато се използват добре дефинирани процедури за вземане на проби, в извадката може да се запази известно отклонение поради фактори като това кой отговаря на телефонни обаждания или кой се разхожда по определени улици, когато се събират мнения за прогнозиране на предизборно проучване. В такива случаи може да е трудно да се получат напълно неутрални извадки, но статистиците могат да измерят колко пристрастия остават налице.

В: Има ли различни видове извадки?


О: Да, има различни видове извадки, включително пълни извадки, които включват всички елементи, които имат дадени свойства, и безпристрастни/представителни извадки, които включват подбор на елементи от пълни извадки, без да зависят от техните свойства. Начинът на получаване на извадката, както и нейният размер, оказват влияние върху начина, по който се разглеждат данните.

AlegsaOnline.com - 2020 / 2023 - License CC3