Законът за големите числа (ЗГЧ) е теорема от статистиката. Разгледайте някакъв процес, в който се случват случайни резултати. Например една случайна величина се наблюдава многократно. Тогава средната стойност на наблюдаваните стойности ще бъде стабилна в дългосрочен план. Това означава, че в дългосрочен план средната стойност на наблюдаваните стойности ще се приближава все повече до очакваната стойност.
При хвърляне на зарове числата 1, 2, 3, 4, 5 и 6 са възможните резултати. Всички те са еднакво вероятни. Средната стойност на популацията (или "очакваната стойност") на резултатите е:
(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5.
Следващата графика показва резултатите от експеримент с хвърляния на зар. При този експеримент се вижда, че средната стойност на хвърлянията на заровете първоначално варира в широки граници. Както се предвижда от LLN, средната стойност се стабилизира около очакваната стойност от 3,5, когато броят на наблюденията стане голям.

Какво точно гласи Законът за големите числа
В неформален смисъл ЗГЧ твърди: ако повтаряме независими опити от един и същи тип (напр. хвърляне на зар, хвърляне на монета, измерване на физическа величина) и изчисляваме средната стойност на резултатите, то с увеличаването на броя на опитите тази средна ще се доближава до истинската (очакваната) стойност на разпределението.
Има две основни формулировки, които често се споменават:
- Слаб закон на големите числа (Weak Law) — казва, че средната стойност на n наблюдения (sample mean) се приближава към очакването по вероятност, т.е. за всяко ε > 0 вероятността средната да се отклонява от очакването с повече от ε отива към 0, когато n → ∞.
- Силен закон на големите числа (Strong Law) — по-силен резултат: средната стойност се доближава към очакването почти сигурно (с вероятност 1). Това означава, че траекторията на средните почти винаги ще конвергира към очакваната стойност.
Формули в близък до учебник стил
Нека X1, X2, ..., Xn са независими и идентично разпределени (i.i.d.) случайни величини с очакване E[X1] = μ (крайно число). Обозначим sample mean със S_n = (X1 + X2 + ... + Xn) / n. Тогава:
- (Слаб ЗГЧ) S_n → μ в вероятност, когато n → ∞.
- (Силен ЗГЧ) S_n → μ почти сигурно, когато n → ∞.
Условия и изключения
- За класическата версия обичайно се изисква независимост и еднакво разпределение и крайно очакване. Има и по-общи версии, които позволяват слаба зависимост или различни разпределения при допълнителни условия.
- ЗГЧ не дава скоростта на сближаване — само гарантира, че сближаването ще настъпи. За информация за скоростта се използва централната гранична теорема (ЦГТ), която гласи, че отклонението на сумата около средната е от порядъка на sqrt(n).
- Ако случайните величини нямат крайно очакване (пример: Коши разпределение), ЗГЧ може да не важи.
Интуиция и пример със зар
Интуитивно, когато броят на наблюденията е малък, случайни колебания могат да дадат средна, различна от очакването. С нарастване на n тези случайни отклонения се "усредняват" и влиянието на отделни екстремни стойности намалява, затова средната стойност се приближава до μ.
В примера със заровете очакваната стойност е 3.5. Ако хвърлите зара 10 пъти, средната може да е 4.2 или 2.8 — това е нормално. Ако хвърлите зара 10 000 пъти, средната ще бъде много близко до 3.5 — това е ефектът, описан от ЗГЧ.
Практически приложения
- В застраховането и финансите: рискът на портфейл от много независими експозиции обикновено може да се предвиди по-точнее, защото средните загуби стабилизират.
- В социологически проучвания и изборни анкети: със засилване на размера на извадката оценките (процентите) стават по-стабилни и по-близки до истинските пропорции в популацията.
- Всимулации и експерименти: повтаряне на експеримент много пъти дава по-точна оценка на очакваната стойност на интересна величина.
Чести грешки при тълкуване
- Гемблерска заблуда (gambler's fallacy): ЗГЧ не означава, че след серия от "неуспешни" резултати следва задължително да се появи "успех" — индивидуалните събития остават независими, докато средната на много събития се стабилизира.
- ЗГЧ говори за средните или относителните честоти при голям брой повторения, а не за единични случаи.
- Не всяко разпределение гарантира ЗГЧ — трябва да са изпълнени съответните условия (напр. крайно очакване).
Кратка идея за доказателство
- За слабия закон често се използва неравенството на Чебишев: Var(S_n) = Var(X1)/n, което показва, че вероятността S_n да се отклони от μ с повече от ε намалява като 1/n и следователно отива към 0.
- За силния закон има по-технични аргументи (напр. използване на неравенството на Борел–Кантели и редица условия за сближаване почти сигурно). Тези доказателства показват, че с вероятност 1 само крайно много "лоши" отклонения могат да настъпят.
Обобщение
Законът за големите числа е основен резултат, който осигурява връзката между емпиричните (наблюдаваните) средни и теоретичните очаквания при многократно повтаряне на случайни опити. Той е основа за статистическата индукция, оценките на параметри и много практически приложения, но трябва да се прилага внимателно, като се имат предвид условията за валидност и разликата между "средна стойност" и "отделен резултат".