- Формула и уравнения
- Разлики с биномичното разпределение
- Примери
- Практически приложения
- Приближаване на биномичното разпределение с разпределението на Poisson
- Решени упражнения
- Упражнение 1
- Решение в)
- Упражнение 2
- Решение за)
- Препратки
На разпределението на Поасон е дискретна разпределение на вероятността, чрез която е възможно да се знае вероятността, че в голяма проба размер и по време на определен интервал, събитие, чиято вероятност е малък ще се случи.
Често пъти разпределението на Poisson може да се използва вместо биномното разпределение, стига да са изпълнени следните условия: голяма проба и малка вероятност.
Фигура 1. Графика на разпределението на Poisson за различни параметри. Източник: Wikimedia Commons.
Симеон-Дени Поасон (1781-1840) създаде тази дистрибуция, която носи неговото име, много полезна, когато става дума за непредвидими събития. Poisson публикува резултатите си през 1837 г., труд за разследване на вероятността от настъпване на погрешни наказателни присъди.
По-късно други изследователи адаптират разпределението в други области, например, броя на звездите, които могат да бъдат намерени в определен обем от пространството, или вероятността войник да умре от ритник на кон.
Формула и уравнения
Математическата форма на разпределението на Поасон е следната:
- μ (също понякога обозначаван като λ) е средната стойност или параметър на разпределението
- номер на Ойлер: e = 2.71828
- Вероятността за получаване на y = k е P
- k е броят на успехите 0, 1,2,3…
- n е броят на тестовете или събитията (размер на извадката)
Дискретните случайни променливи, както подсказва името им, зависят от случайността и приемат само дискретни стойности: 0, 1, 2, 3, 4…, k.
Средната стойност на разпределението се определя от:
Отклонението σ, което измерва разпространението на данните, е друг важен параметър. За разпространението на Poisson това е:
σ = μ
Поасон определи, че когато n → ∞ и p → 0, средната μ - наричана още очакваната стойност - клони към константа:
-Разгледаните събития или събития са независими един от друг и се случват на случаен принцип.
-Вероятността P за дадено събитие да се случи през определен период от време е много малка: P → 0.
-Вероятността за възникване на повече от едно събитие във времевия интервал е 0.
-Средната стойност се доближава до константа, дадена от: μ = np (n е размерът на извадката)
-Когато дисперсията σ е равна на μ, тъй като приема по-големи стойности, променливостта също става по-голяма.
-Евентите трябва да бъдат разпределени равномерно в използвания интервал от време.
-Наборът от възможни стойности на събитието y е: 0,1,2,3,4….
- Сумата от i променливи, които следват разпределение на Poisson, е също друга променлива на Poisson. Средната му стойност е сумата от средните стойности на тези променливи.
Разлики с биномичното разпределение
Разпределението на Поасон се различава от биномичното разпределение по следните важни начини:
-Биномиалното разпределение се влияе както от размера на пробата n, така и от вероятността P, но разпределението на Poisson се влияе само от средната μ.
-В биномиално разпределение възможните стойности на случайната променлива у са 0,1,2,…, N, докато в разпределението на Поасон няма горна граница за тези стойности.
Примери
Първоначално Poisson прилага известната си дистрибуция в съдебни дела, но на индустриално ниво, едно от най-ранните му приложения е било при варенето на бира. В този процес културите за дрожди се използват за ферментация.
Дрождите се състоят от живи клетки, чиято популация е променлива във времето. При производството на бира е необходимо да се добави необходимото количество, затова е необходимо да се знае броят на клетките на единица обем.
По време на Втората световна война разпределението на Poisson се използва, за да разбере дали германците всъщност се прицелват в Лондон от Кале или просто стрелят на случаен принцип. Това беше важно за съюзниците, за да определят колко добра е технологията на разположение на нацистите.
Практически приложения
Приложенията на дистрибуцията на Poisson винаги се отнасят за броя във времето или броя в пространството. И тъй като вероятността за настъпване е малка, той е известен и като "закон за редки събития".
Ето списък на събития, които попадат в една от следните категории:
-Регистрация на частиците при радиоактивен разпад, който подобно на растежа на клетките от дрожди е експоненциална функция.
-Брой посещения на определен уебсайт.
-Пристигане на хора до линия за заплащане или присъствие (теория на опашките).
-Брой автомобили, които преминават определена точка на път, през даден интервал от време.
Фигура 2. Броят на автомобилите, преминаващи през точка, приблизително следва разпределението на Poisson. Източник: Pixabay
-Мутации, претърпени в определена ДНК верига след получаване на излагане на радиация.
-Брой метеорити с диаметър, по-голям от 1 м, паднали за една година.
-Дефекти на квадратен метър плат.
-Количество на кръвни клетки в 1 кубичен сантиметър.
-Обаждания в минута до телефонна централа.
-Шоколадов чипс, присъстващ в 1 кг тесто за кекс.
-Брой дървета, заразени от определен паразит в 1 хектар гора.
Обърнете внимание, че тези произволни променливи представляват броя пъти, когато дадено събитие се случи през определен период от време (разговори в минута до телефонната станция) или даден регион на пространството (дефекти на плат на квадратен метър).
Тези събития, както вече е установено, са независими от времето, което е минало от последното събитие.
Приближаване на биномичното разпределение с разпределението на Poisson
Разпределението на Поасон е добро приближение към разпределението на биноми, стига:
-Размерът на пробата е голям: n ≥ 100
-Вероятността p е малка: p ≤ 0,1
- μ е в реда на: np ≤ 10
В такива случаи разпределението на Poisson е отличен инструмент, тъй като биномното разпределение може да бъде трудно да се приложи в тези случаи.
Решени упражнения
Упражнение 1
Сеизмологично проучване установи, че през последните 100 години по целия свят е имало 93 големи земетресения, най-малко 6,0 по скалата на Рихтер -logarithmic-. Да предположим, че в този случай разпределението на Poisson е подходящ модел. Намирам:
а) Средната честота на големи земетресения годишно.
б) Ако P (y) е вероятността от земетресения, възникнали през произволно избрана година, намерете следните вероятности:
Това е доста по-малко от P (2).
Резултатите са изброени по-долу:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Например, можем да кажем, че има 39,5% вероятност да не се случи голямо земетресение през дадена година. Или че има 5.29% от 3 големи земетресения, възникнали през тази година.
Решение в)
в) Честотите се анализират, като се умножават по n = 100 години:
39,5; 36,7; 17.1; 5,29; 1.23; 0,229; 0,0355 и 0,00471.
Например:
- Честота от 39,5 показва, че 0 големи земетресения се случват за 39,5 от 100 години, можем да кажем, че е доста близо до реалния резултат от 47 години без големи земетресения.
Нека сравним още един резултат от Поасон с реалните резултати:
- Получената стойност от 36,7 означава, че в период от 37 години има 1 голямо земетресение. Действителният резултат е, че за 31 години имаше 1 голямо земетресение, което е добро съответствие с модела.
- 17,1 години се очакват с 2 големи земетресения и се знае, че за 13 години, което е близка стойност, наистина е имало 2 големи земетресения.
Следователно моделът на Poisson е приемлив за този случай.
Упражнение 2
Една компания изчислява, че броят на компонентите, които се провалят, преди да достигнат 100 работни часа, следва разпределение на Poisson. Ако средният брой на отказите е 8 за това време, намерете следните вероятности:
а) че компонентът се проваля за 25 часа.
б) Отказ на по-малко от два компонента за 50 часа.
в) Най-малко три компонента се провалят за 125 часа.
Решение за)
а) Известно е, че средната стойност на отказите за 100 часа е 8, следователно за 25 часа се очакват една четвърт от отказите, тоест 2 повреди. Това ще бъде параметърът μ.
Вероятността 1 компонент да не бъде заявена, случайната променлива е "компоненти, които се провалят преди 25 часа" и стойността му е y = 1. Като заместваме функцията на вероятността:
Въпросът обаче е вероятността по-малко от два компонента да се откажат за 50 часа, а не че точно два компонента се повредят за 50 часа, следователно трябва да добавим вероятностите, които:
-Никой не се проваля
- Провал само 1
Параметърът μ на разпределението в този случай е:
μ = 8 + 2 = 10 откази за 125 часа.
P (3 или повече компоненти се провалят) = 1- P (0) - P (1) - P (2) =
Препратки
- MathWorks. Разпределение на Poisson. Възстановени от: es.mathworks.com
- Mendenhall, W. 1981. Статистика за управление и икономика. 3-ти. издание. Grupo Редакция Iberoamérica.
- Стат Трек. Научете се на статистика. Разпределение на Poisson. Възстановени от: stattrek.com,
- Triola, M. 2012. Елементарна статистика. 11-ти. Ed. Pearson Education.
- Wikipedia. Разпределение на Poisson. Възстановено от: en.wikipedia.org