- Формули и уравнения
- Важни статистически променливи
- Модел и свойства
- Основни свойства на хипергеометричното разпределение
- Приближаване с помощта на биномиално разпределение
- Пример 2
- Решени упражнения
- Упражнение 1
- Решение
- Упражнение 2
- Решение
- Упражнение 3
- Решение за
- Решение c
- Препратки
В хипергеометричното разпределение е дискретна статистическа функция, подходящ за изчисляване на вероятността в рандомизирани експерименти с две възможни резултати. Условието, което се изисква, за да се приложи е, че това са малки популации, при които тегленията не се заменят и вероятностите не са постоянни.
Следователно, когато елемент от популацията е избран да знае резултата (истинен или фалшив) на определена характеристика, същият този елемент не може да бъде избран отново.
Фигура 1. В болтова популация като тази, със сигурност има дефектни екземпляри. Източник: Pixabay
Със сигурност следващият избран елемент е по-вероятно да получи истински резултат, ако предишният елемент има отрицателен резултат. Това означава, че вероятността варира с извличането на елементи от извадката.
Основните приложения на хипергеометричното разпределение са: контрол на качеството в процеси с малко население и изчисляване на вероятностите в хазартните игри.
Що се отнася до математическата функция, която определя хипергеометричното разпределение, тя се състои от три параметъра, които са:
- брой на популационните елементи (N)
- Размер на пробата (m)
- Брой събития в цялото население с благоприятен (или неблагоприятен) резултат от изследваната характеристика (n).
Формули и уравнения
Формулата за хипергеометричното разпределение дава вероятността Р да се появят х благоприятни случаи на определена характеристика. Начинът да го напишете математически въз основа на комбинаторните числа е:
В предишния израз N, n и m са параметри и x е самата променлива.
- Общото население е N.
-Брой положителни резултати на определена двоична характеристика по отношение на общото население е n.
-Качеството на елементите в пробата е m.
В този случай X е случайна променлива, която приема стойността x, а P (x) показва вероятността от възникване на x благоприятни случаи на изследваната характеристика.
Важни статистически променливи
Други статистически променливи за хипергеометричното разпределение са:
- Средно μ = m * n / N
- Вариант σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Стандартно отклонение σ, което е квадратният корен на дисперсията.
Модел и свойства
За да стигнем до модела на хипергеометричното разпределение, започваме от вероятността да получим х благоприятни случаи в извадка с размер m. Тази извадка съдържа елементи, които съответстват на свойството, което се изследва, и елементи, които не.
Спомнете си, че n представлява броят на благоприятните случаи в общата съвкупност от N елементи. Тогава вероятността ще бъде изчислена така:
Изразявайки горното под формата на комбинаторни числа, се достига следния модел на разпределение на вероятностите:
Основни свойства на хипергеометричното разпределение
Те са както следва:
- Извадката трябва винаги да е малка, дори ако популацията е голяма.
- Елементите от извадката се извличат един по един, без да се включват обратно в популацията.
- Свойството, което трябва да се изучава, е двоично, тоест може да приеме само две стойности: 1 или 0, или вярно или невярно.
Във всеки етап на извличане на елемента вероятността се променя в зависимост от предишните резултати.
Приближаване с помощта на биномиално разпределение
Друго свойство на хипергеометричното разпределение е, че то може да се сближи с биномиално разпределение, обозначено Bi, стига популацията N да е голяма и поне 10 пъти по-голяма от пробата m. В този случай ще изглежда така:
Вероятността х = 3 винта в пробата да е дефектна е: P (500, 5, 60, 3) = 0,0129.
От своя страна, вероятността х = 4 винта от шестдесетте проби да са дефектни е: P (500, 5, 60; 4) = 0,0008.
И накрая, вероятността х = 5 винта в тази проба да са дефектни е: P (500, 5, 60; 5) = 0.
Но ако искате да знаете вероятността в тази проба да има повече от 3 дефектни винта, тогава трябва да получите кумулативната вероятност, като добавите:
Този пример е илюстриран на фигура 2, получен чрез използване на GeoGebra, безплатен софтуер, широко използван в училища, институти и университети.
Фигура 2. Пример за хипергеометрично разпределение. Изготвил Ф. Сапата с GeoGebra.
Пример 2
Испанската палуба има 40 карти, от които 10 имат злато, а останалите 30 не. Да предположим, че 7 карти се изтеглят на случаен принцип от тази тесте, които не се рекордират в тестето.
Ако X е броят на златите, присъстващи в изтеглените 7 карти, тогава вероятността, че ще имате x злати при теглене на 7 карти, се дава от хипергеометричното разпределение P (40,10,7; x).
Нека видим това по следния начин: за да изчислим вероятността да имаме 4 злати в рисунка с 7 карти, използваме формулата на хипергеометричното разпределение със следните стойности:
И резултатът е: 4,57% вероятност.
Но ако искате да знаете вероятността да получите повече от 4 карти, тогава трябва да добавите:
Решени упражнения
Следващият набор от упражнения има за цел да илюстрира и усвои концепциите, представени в тази статия. Важно е читателят да се опита да ги разреши сам, преди да погледне решението.
Упражнение 1
Фабрика за презервативи установи, че от всеки 1000 презерватива, произведени от определена машина, 5 са дефектни. За контрол на качеството се вземат на случаен принцип 100 презерватива и партидата се отхвърля, ако има поне един или повече дефекти. Отговор:
а) Каква е възможността много 100 да бъдат изхвърлени?
б) Ефективен ли е този критерий за контрол на качеството?
Решение
В този случай ще се появят много големи комбинаторни числа. Изчислението е трудно, освен ако нямате подходящ софтуерен пакет.
Но тъй като това е голяма популация и извадката е десет пъти по-малка от общата популация, е възможно да се използва приближението на хипергеометричното разпределение чрез биномиално разпределение:
В горния израз C (100, x) е комбинаторно число. Тогава вероятността да има повече от един дефект ще се изчисли така:
Това е отлично приближение, ако се сравнява със стойността, получена чрез прилагане на хипергеометричното разпределение: 0,4102
Може да се каже, че с 40% вероятност партида от 100 профилактични средства трябва да се изхвърли, което не е много ефективно.
Но ако сте малко по-малко взискателни в процеса на контрол на качеството и изхвърлите партидата 100 само ако има два или повече дефекта, вероятността да изхвърлите партидата ще падне до само 8%.
Упражнение 2
Машината от пластмасов блок работи по такъв начин, че от всеки 10 парчета, едното излиза деформирано. В проба от 5 броя, колко е вероятно само едно парче да е дефектно?
Решение
Население: N = 10
Брой дефекти за всеки N: n = 1
Размер на пробата: m = 5
Следователно има 50% вероятност в проба от 5 блок да се деформира.
Упражнение 3
В среща на млади възпитаници на гимназията присъстват 7 дами и 6 господа. Сред момичетата 4 изучават хуманитарни науки и 3 науки. В момчешката група 1 изучава хуманитарни науки и 5 науки. Изчислете следното:
a) Избор на три момичета на случаен принцип: колко е вероятно всички те да учат хуманитарни науки?
б) Ако трима участници в срещата на приятелите са избрани на случаен принцип: каква е вероятността трима от тях, независимо от пола, да учат науката и трите, или хуманитарните науки също и трите?
в) Сега изберете произволно двама приятели и наречете х случайната променлива „брой на тези, които изучават хуманитарни науки“. Между двата избрани определете средната или очакваната стойност на x и дисперсията σ ^ 2.
Решение за
Стойностите, които да използвате сега са:
-Население: N = 14
-Качеството, което изучава буквите е: n = 6 и the
-Размер на пробата: m = 3.
-Брой приятели, изучаващи хуманитарни науки: x
Според това x = 3 означава, че и трите изучават хуманитарни науки, но x = 0 означава, че никой не изучава хуманитарни науки. Вероятността и трите да учат едно и също се дава чрез сумата:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099
Тогава имаме 21% вероятност трима участници в срещата, избрани на случаен принцип, да изучат едно и също нещо.
Решение c
Тук имаме следните стойности:
N = 14 обща популация от приятели, n = 6 общ брой в популацията, изучаваща хуманитарни науки, размерът на извадката е m = 2.
Надеждата е:
E (x) = m * (n / N) = 2 * (6/14) = 0.8572
И вариацията:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13) = 0,4521
Препратки
- Дискретни разпределения на вероятностите. Възстановено от: biplot.usal.es
- Статистика и вероятност. Хипергеометрично разпределение. Възстановено от: projectdescartes.org
- CDPYE-UGR. Хипергеометрично разпределение. Възстановени от: ugr.es
- Geogebra. Класическа геогебра, вероятностно смятане. Възстановено от geogebra.org
- Опитайте лесно. Решени проблеми на хипергеометричното разпределение. Възстановени от: probafacil.com
- Minitab. Хипергеометрично разпределение. Възстановена от: support.minitab.com
- Университета на Виго. Основни дискретни разпределения. Възстановено от: anapg.webs.uvigo.es
- Vitutor. Статистика и комбинаторика. Възстановена от: vitutor.net
- Weisstein, Eric W. Хипергеометрично разпределение. Възстановени от: mathworld.wolfram.com
- Wikipedia. Хипергеометрично разпределение. Възстановено от: es.wikipedia.com