- формула
- Характеристики на нормалното разпределение
- Интервали на увереност
- Приложения на нормалното разпределение
- пример
- Упражнението е разрешено
- Препратки
В нормалното разпределение или Гаусово разпределение е разпределението на вероятностите в непрекъсната променлива, в който функцията на вероятностите плътност е описан от експоненциална функция на квадратичен и отрицателен аргумент, което води до форма на камбана.
Името на нормалното разпределение идва от факта, че това разпределение е това, което се прилага за най-голям брой ситуации, когато някаква непрекъсната произволна променлива е включена в дадена група или популация.
Фигура 1. Нормално разпределение N (x; μ, σ) и неговата вероятностна плътност f (s; μ, σ). (Собствена разработка)
Примери, при които се прилага нормалното разпределение са: височината на мъжете или жените, отклонения в мярката на някаква физическа величина или в измерими психологически или социологически черти като интелектуалния коефициент или хранителните навици на определен продукт.
От друга страна, тя се нарича гаусска дистрибуция или гаусска камбана, тъй като именно този немски математически гений е кредитиран с откритието си за употребата, която му даде, за да опише статистическата грешка на астрономическите измервания още през 1800 година.
Въпреки това се твърди, че това статистическо разпределение е било публикувано преди това от друг велик математик от френски произход, като Абрахам де Моивре, през 1733г.
формула
Нормалната функция на разпределение в непрекъснатата променлива x с параметри μ и σ се обозначава с:
N (x; μ, σ)
и изрично е написано така:
N (x; µ, σ) = ∫ -∞ x f (s; µ, σ) ds
където f (u; μ, σ) е функцията на плътността на вероятностите:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2))
Константата, която умножава експоненциалната функция във функцията на плътността на вероятностите, се нарича константа на нормализиране и е избрана по такъв начин, че:
N (+ ∞, μ, σ) = 1
Предишният израз гарантира, че вероятността случайната променлива x да е между -∞ и + ∞ е 1, тоест 100% вероятност.
Параметърът μ е средноаритметичната стойност на непрекъснатата случайна променлива x и σ стандартното отклонение или квадратен корен на дисперсията на същата променлива. В случай, че μ = 0 и σ = 1, тогава имаме стандартното нормално разпределение или типичното нормално разпределение:
N (x; μ = 0, σ = 1)
Характеристики на нормалното разпределение
1- Ако случайна статистическа променлива следва нормално разпределение на плътността на вероятността f (s; μ, σ), повечето от данните са групирани около средната стойност μ и са разпръснати около нея по такъв начин, че малко повече от ⅔ от данните са между μ - σ и μ + σ.
2- Стандартното отклонение σ винаги е положително.
3- Формата на функцията за плътност f е подобна на тази на звънец, поради което тази функция често се нарича Гаусова камбана или Гаусова функция.
4- При гаусско разпределение средната стойност, медианата и режимът съвпадат.
5- Точките на преглъщане на функцията на плътността на вероятностите са точно при μ - σ и μ + σ.
6- Функцията f е симетрична по отношение на ос, преминаваща през средната й стойност μ и има асимптотично нула за x ⟶ + ∞ и x ⟶ -∞.
7- Колкото по-висока е стойността на σ, толкова по-голяма е дисперсията, шумът или разстоянието на данните около средната стойност. С други думи, колкото по-високо е σ формата на камбана е по-отворена. От друга страна, σ малък показва, че зарчетата са близки до средната и формата на камбаната е по-затворена или заострена.
8- Функцията на разпределение N (x; μ, σ) показва вероятността случайната променлива да е по-малка или равна на x. Например, на фигура 1 (по-горе) вероятността P, че променливата x е по-малка или равна на 1,5, е 84% и съответства на площта под функция плътност на вероятността f (x; µ, σ) от -∞ до x.
Интервали на увереност
9- Ако данните следват нормално разпределение, тогава 68,26% от тях са между μ - σ и μ + σ.
10- 95.44% от данните, които следват нормално разпределение, са между μ - 2σ и μ + 2σ.
11- 99,74% от данните, които следват нормално разпределение, са между μ - 3σ и μ + 3σ.
12- Ако случайна променлива x следва разпределение N (x; μ, σ), то променливата
z = (x - μ) / σ следва стандартното нормално разпределение N (z; 0.1).
Промяната на променливата x в z се нарича стандартизация или въвеждане и е много полезна, когато се прилагат таблиците на стандартното разпределение към данните, които следват нестандартно нормално разпределение.
Приложения на нормалното разпределение
За да се приложи нормалното разпределение, е необходимо да се премине през изчисляването на интеграла на плътността на вероятността, което от аналитична гледна точка не е лесно и не винаги има компютърна програма, която позволява нейното числено изчисляване. За тази цел се използват таблици с нормализирани или стандартизирани стойности, което в случая μ = 0 и σ = 1 е нищо повече от нормалното разпределение.
Стандартизирана нормална разпределителна таблица (част 1/2)
Стандартизирана нормална таблица за разпространение (част 2/2)
Трябва да се отбележи, че тези таблици не включват отрицателни стойности. Въпреки това, използвайки свойствата на симетрията на функцията на плътност на Гаус, вероятността може да се получат съответните стойности. Решеното упражнение, показано по-долу, показва използването на таблицата в тези случаи.
пример
Да предположим, че имате набор от случайни данни x, които следват нормално разпределение на средно 10 и стандартно отклонение 2. От вас се изисква да намерите вероятността, че:
а) Случайната променлива x е по-малка или равна на 8.
б) е по-малко или равно на 10.
в) че променливата x е под 12.
г) Вероятността х-стойност да е между 8 и 12.
Решение:
а) За да отговорите на първия въпрос, просто трябва да изчислите:
N (x; μ, σ)
С x = 8, μ = 10 и σ = 2. Ние осъзнаваме, че е интеграл, който няма аналитично решение в елементарни функции, но решението се изразява като функция на функцията за грешка erf (x).
От друга страна, съществува възможност за решаване на интеграла в числова форма, което правят много калкулатори, електронни таблици и компютърни програми като GeoGebra. Следващата фигура показва числовото решение, съответстващо на първия случай:
Фигура 2. Плътност на вероятността f (x; μ, σ). Засенчената зона представлява P (x ≤ 8). (Собствена разработка)
а отговорът е, че вероятността х е под 8 е:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
б) В този случай се опитваме да намерим вероятността случайната променлива х да е под средната стойност, която в този случай е на стойност 10. Отговорът не изисква никакво изчисление, тъй като знаем, че половината от данните са под средна, а другата половина над средното. Следователно отговорът е:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
в) За да отговорим на този въпрос, трябва да изчислим N (x = 12; μ = 10, σ = 2), което може да се направи с калкулатор, който има статистически функции или чрез софтуер като GeoGebra:
Фигура 3. Плътност на вероятността f (x; μ, σ). Засенчената зона представлява P (x ≤ 12). (Собствена разработка)
Отговорът на част в може да се види на фигура 3 и е:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0.8413.
г) За да намерим вероятността случайната променлива x да е между 8 и 12, можем да използваме резултатите от части a и c, както следва:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0.8413 - 0.1587 = 0.6826 = 68.26%.
Упражнението е разрешено
Средната цена на акциите на компанията е 25 долара със стандартно отклонение от 4 долара. Определете вероятността, че:
а) Една акция е с цена, по-малка от 20 долара.
b) Цената е по-голяма от 30 долара.
в) Цената е между 20 и 30 долара.
Използвайте стандартните нормални таблици за разпространение, за да намерите отговорите.
Решение:
За да използвате таблиците, е необходимо да преминете към нормализираната или въведена променлива z:
$ 20 в нормализираната променлива е равен на z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 и
$ 30 в нормализираната променлива е равен на z = ($ 30 - $ 25) / $ 4 = +5/4 = +1.25.
а) $ 20 се равнява на -1,25 в нормализираната променлива, но таблицата няма отрицателни стойности, така че поставяме стойността +1,25, която дава стойността на 0,8944.
Ако от тази стойност се извади 0,5, резултатът ще бъде площта между 0 и 1,25, която между другото е идентична (по симетрия) с площта между -1,25 и 0. Резултатът от изваждането е 0,8944 - 0,5 = 0,3944, което е площта между -1,25 и 0.
Но интересната е площта от -∞ до -1.25, което ще бъде 0.5 - 0.3944 = 0.1056. Поради това се стига до заключението, че вероятността акциите да са под 20 долара е 10,56%.
б) $ 30 във въведената променлива z е 1,25. За тази стойност таблицата показва числото 0.8944, което съответства на площта от -∞ до +1.25. Площта между +1,25 и + ∞ е (1 - 0,8944) = 0,1056. С други думи, вероятността дадена акция струва повече от 30 долара е 10,56%.
в) Вероятността дадено действие да има разходи между $ 20 и $ 30 се изчислява, както следва:
100% -10,56% - 10,56% = 78,88%
Препратки
- Статистика и вероятност. Нормална дистрибуция. Възстановено от: projectdescartes.org
- Geogebra. Класическа геогебра, вероятностно смятане. Възстановено от geogebra.org
- MathWorks. Гаусско разпределение. Възстановени от: es.mathworks.com
- Mendenhall, W. 1981. Статистика за управление и икономика. 3-ти. издание. Grupo Редакция Iberoamérica.
- Стат Трек. Научете се на статистика. Разпределение на Poisson. Възстановени от: stattrek.com,
- Triola, M. 2012. Елементарна статистика. 11-ти. Ed. Pearson Education.
- Университета на Виго. Основни непрекъснати дистрибуции. Възстановено от: anapg.webs.uvigo.es
- Wikipedia. Нормална дистрибуция. Възстановено от: es.wikipedia.org