Разпределение на честотите | списък на стойностите, които дадена променлива приема в извадка

В статистиката честотното разпределение е списък на стойностите, които дадена променлива приема в извадката. Обикновено това е списък, подреден по количество. То показва колко пъти се появява всяка стойност. Например, ако 100 души оценяват по петстепенна скала на Ликерт съгласието си с дадено твърдение по скала, по която 1 означава силно съгласие, а 5 - силно несъгласие, честотното разпределение на техните отговори може да изглежда така:

Тази проста таблица има два недостатъка. Когато променливата може да приема непрекъснати стойности вместо дискретни или когато броят на възможните стойности е твърде голям, конструирането на таблицата е трудно, ако не е невъзможно. В такива случаи се използва малко по-различна схема, базирана на обхвата на стойностите. Например, ако разглеждаме височината на учениците в един клас, таблицата на честотите може да изглежда по следния начин.



  Това е пирамидата на населението на Китай за 2005 г.   Zoom
Това е пирамидата на населението на Китай за 2005 г.  

Пример за разпределение на (абсолютна) честота. Това е пирамидата на населението на Ангола за 2005 г.  Zoom
Пример за разпределение на (абсолютна) честота. Това е пирамидата на населението на Ангола за 2005 г.  

Приложения

Управлението и работата с данни в честотни таблици е много по-просто, отколкото работата с необработени данни. Съществуват прости алгоритми за изчисляване на медиана, средна стойност (статистика), стандартно отклонение и т.н. от тези таблици.

Проверката на статистически хипотези се основава на оценката на разликите и приликите между честотните разпределения. Тази оценка включва мерки за централна тенденция или средни стойности, като средна стойност и медиана, и мерки за вариабилност или статистическа дисперсия, като стандартно отклонение или дисперсия.

Разпределението на честотите се счита за изкривено, когато средната и медианата му са различни. Куртозата на едно честотно разпределение е концентрацията на резултатите в средната стойност или колко високо изглежда разпределението, ако се изобрази графично - например в хистограма. Ако разпределението е по-пиково от нормалното разпределение, се казва, че е лептокуртично; ако е по-малко пиково, се казва, че е платикуртично.

Честотните разпределения се използват и в честотния анализ за разбиване на кодове и се отнасят до относителната честота на буквите в различните езици.

  • Контур
  • Индекс

Описателна статистика

Непрекъснати данни

Център

  • Медиана
  • Режим

Дисперсия

  • Отклонение
  • Стандартно отклонение
  • Средно абсолютно отклонение
  • Коефициент на вариация
  • Персентил
  • Обхват
  • Междуквартален диапазон

Форма

    • Скенесис
    • Куртоза
    • L-моменти

Данни за преброяване

  • Индекс на дисперсия

Обобщаващи таблици

  • Групирани данни
  • Честотно разпределение
  • Таблица за непредвидени обстоятелства

Зависимост

  • Корелация продукт-момент на Пиърсън
  • Корелация на ранга
  • Частична корелация
  • Диаграма на разсейване

Графики

  • Бар диаграма
  • Biplot
  • Кутия с диаграми
  • Контролна диаграма
  • Корелограма
  • Диаграма на вентилатора
  • Горски участък
  • Хистограма
  • Кръгова диаграма
  • Q-Q парцел
  • Диаграма на изпълнение
  • Диаграма на разсейване
  • Дисплей със стъбла и листа
  • Радарна диаграма
  • Сюжет за цигулка

Събиране на данни

Дизайн на проучването

  • Население
  • Статистика
  • Размер на ефекта
  • Статистическа мощ
  • Оптимален дизайн
  • Определяне на размера на извадката
  • Репликация
  • Липсващи данни

Методология на проучването

    • стратифициран
    • клъстер

Контролирани експерименти

Адаптивни дизайни

  • Адаптивно клинично изпитване
  • Дизайн нагоре-надолу
  • Стохастична апроксимация

Наблюдателни проучвания

  • Кръстосано проучване
  • Кохортно проучване
  • Естествен експеримент
  • Квазиексперимент

Статистически изводи

Статистическа теория

  • Население
  • Статистика
  • Разпределение на вероятностите
  • Разпределение на извадката
    • Статистика на поръчките
  • Емпирично разпределение
    • Оценка на плътността
  • Статистически модел
    • Спецификация на модела
    • Lp пространство
  • Параметър
    • местоположение
    • скала
    • форма
  • Параметрична фамилия
    • Вероятност (монотонна)
    • Семейство с мащаб на местоположението
    • Семейство експоненциални
  • Пълнота
  • Достатъчност
  • Статистическа функционалност
    • Bootstrap
    • U
    • V
  • Оптимално решение
    • функция на загубите
  • Ефективност
  • Статистическо разстояние
    • дивергенция
  • Асимптотика
  • Устойчивост

Честотен извод

Оценка на точките

  • Уравнения за оценяване
    • Максимална вероятност
    • Метод на моментите
    • M-оценител
    • Минимално разстояние
  • Безпристрастни оценки
    • Средна-необезпокоявана минимална дисперсия
      • Rao-Blackwellization
      • Теорема на Леман-Шефе
    • Медиана без предубеждения
  • Plug-in

Оценка на интервала

  • Доверителен интервал
  • Pivot
  • Интервал на вероятност
  • Интервал на прогнозиране
  • Интервал на допустимо отклонение
  • Повторно вземане на проби
    • Bootstrap
    • Jackknife

Проверка на хипотези

  • 1 и 2 опашки
  • Захранване
    • Единно най-силен тест
  • Тест за пермутация
    • Тест за рандомизация
  • Множество сравнения

Параметрични тестове

  • Съотношение на вероятност
  • Коефициент за резултат/разстояние
  • Wald

Специфични тестове

  • Z-тест (нормален)
  • t-тест на студента
  • F-тест

Доброта на прилягане

  • Хи-квадрат
  • G-тест
  • Колмогоров-Смирнов
  • Андерсън-Дарлинг
  • Lilliefors
  • Jarque-Bera
  • Нормалност (Shapiro-Wilk)
  • Тест за съотношение на вероятност
  • Избор на модел
    • Кръстосано валидиране
    • AIC
    • BIC

Статистически данни за ранга

  • Знак
    • Медиана на извадката
  • Подписан ранг (Wilcoxon)
    • Оценка на Hodges-Lehmann
  • Рангова сума (Mann-Whitney)
  • Непараметрична аналогия
    • 1-посочен (Kruskal-Wallis)
    • 2-посочен (Friedman)
    • Поръчана алтернатива (Jonckheere-Terpstra)

Байесов извод

  • Байесова вероятност
    • предишен
    • задна част
  • Достоверен интервал
  • Коефициент на Бейс
  • Бейсов оценител
    • Максимална апостериорна оценка
  • Корелация
  • Регресионен анализ

Корелация

  • Продукт-момент на Пиърсън
  • Частична корелация
  • Объркваща променлива
  • Коефициент на детерминация

Регресионен анализ

  • Грешки и остатъци
  • Валидиране на регресията
  • Модели със смесени ефекти
  • Модели с едновременни уравнения
  • Многомерни адаптивни регресионни сплайни (MARS)

Линейна регресия

  • Проста линейна регресия
  • Обикновени най-малки квадрати
  • Общ линеен модел
  • Бейсова регресия

Нестандартни предиктори

  • Нелинейна регресия
  • Непараметричен
  • Полупараметричен
  • Изотоничен
  • Надежден
  • Хетероскедастичност
  • Хомоскедастичност

Обобщен линеен модел

  • Експоненциални семейства
  • Логистична (Бернули) / Биномна / Поасонова регресия

Разделяне на дисперсията

  • Дисперсионен анализ (ANOVA, anova)
  • Анализ на ковариацията
  • Многовариантен ANOVA
  • Степени на свобода

Категорични / Многомерни / Времеви редове / Анализ на оцеляването

Категорични

  • Капа на Коен
  • Таблица за непредвидени обстоятелства
  • Графичен модел
  • Логически линеен модел
  • Тест на McNemar
  • Статистика на Кокран-Мантел-Хаензел

Многовариантност

  • Регресия
  • Manova
  • Основни компоненти
  • Канонична корелация
  • Дискриминационен анализ
  • Клъстерен анализ
  • Класификация
  • Модел на структурното уравнение
    • Факторен анализ
  • Многомерни разпределения
    • Елиптични разпределения
      • Нормален

Времеви редове

Обща информация

  • Разлагане
  • Тенденция
  • Стационарност
  • Сезонно приспособяване
  • Експоненциално изглаждане
  • Коинтеграция
  • Структурно прекъсване
  • Причинно-следствена връзка на Грейнджър

Специфични тестове

  • Dickey-Fuller
  • Йохансен
  • Q-статистика (Ljung-Box)
  • Дърбин-Уотсън
  • Breusch-Godfrey

Времева област

  • Автокорелация (ACF)
    • частичен (PACF)
  • Кръстосана корелация (XCF)
  • Модел ARMA
  • Модел ARIMA (Box-Jenkins)
  • Авторегресивна условна хетероскедастичност (ARCH)
  • Векторна авторегресия (VAR)

Честотна област

  • Оценка на спектралната плътност
  • Анализ на Фурие
  • Уейвлет
  • Вероятност на Уитъл

Оцеляване

Функция за оцеляване

  • Оценка на Каплан-Майер (граница на продукта)
  • Модели на пропорционални опасности
  • Модел на ускореното време на отказ (AFT)
  • Време за първо попадение

Функция на опасност

  • Оценка на Нелсън-Аален

Тест

  • Тест Log-rank

Приложения

Биостатистика

Инженерна статистика

  • Chemometrics
  • Инженерни методи
  • Вероятностен дизайн
  • Контрол на процеса/качеството
  • Надеждност
  • Идентификация на системата

Социална статистика

  • Актюерска наука
  • Преброяване
  • Статистика за престъпността
  • Демография
  • Иконометрия
  • Jurimetrics
  • Национални сметки
  • Официална статистика
  • Статистика на населението
  • Психометрия

Пространствена статистика

  • Картография
  • Статистика за околната среда
  • Географска информационна система
  • Геостатистика
  • Kriging


 

Въпроси и отговори

В: Какво представлява разпределението на честотите?


О: Честотното разпределение е списък на стойностите, които дадена променлива приема в извадката, подредени по количество. То показва колко пъти се появява всяка стойност.

В: Как може да изглежда честотното разпределение на отговорите на петстепенна скала на Ликерт?


О: Честотното разпределение на отговорите на петстепенна скала на Ликерт може да изглежда като проста таблица, показваща броя на хората, които са оценили всяка точка от скалата.

В: Кои са двата недостатъка на използването на този вид таблица?


О: Двата недостатъка на използването на този тип таблици са, че то може да бъде трудно или дори невъзможно, когато става въпрос за непрекъснати стойности или когато има твърде много възможни стойности.

В: С какво се различава тази схема при работа с непрекъснати стойности или с голям брой възможни стойности?


О: Когато се работи с непрекъснати стойности или голям брой възможни стойности, може да се използва малко по-различна схема, базирана на диапазон от стойности.

В: Как може да изглежда таблицата с честотите за височината на учениците?


О: Честотната таблица за височината на учениците може да показва диапазони и колко ученици попадат във всеки диапазон.


В: Каква информация предоставя честотното разпределение?


О: Честотното разпределение предоставя информация за това колко често определени променливи се появяват в извадките и как са разпределени в тези извадки.

AlegsaOnline.com - 2020 / 2023 - License CC3