- Размерът на пробата
- Случай 1: размерът на населението не е известен
- Нива на увереност и съответните им Z стойности
- Случай 2: размерът на населението е известен
- Примери
- Проучвания и въпросници
- QA
- предимство
- Недостатъци
- Упражнението е разрешено
- Решение
- Препратки
В случайна извадка е как да изберете статистически представителна извадка от дадена популация. Част от принципа, че всеки елемент в пробата трябва да има еднаква вероятност да бъде избран.
Жребият е пример за случайна извадка, при която на всеки член от популацията участник се присвоява число. За да изберете числата, съответстващи на наградите за томбола (пробата), се използва някаква произволна техника, например извличане от пощенска кутия на числата, записани на идентични карти.
Фигура 1. При случайно вземане на проби, извадката се взема от популацията на случаен принцип, използвайки някаква техника, която гарантира, че всички елементи имат еднаква вероятност да бъдат избрани. Източник: netquest.com.
При случайна извадка е от съществено значение да се избере подходящият размер на извадката, тъй като непредставителната извадка от популацията може да доведе до погрешни заключения поради статистически колебания.
Размерът на пробата
Съществуват формули за определяне на правилния размер на пробата. Най-важният фактор, който трябва да се вземе предвид е дали е известен или не размерът на популацията. Нека да разгледаме формулите, за да определим размера на извадката:
Случай 1: размерът на населението не е известен
Когато размерът на популацията N е неизвестен, е възможно да се избере извадка с подходящ размер n, за да се определи дали определена хипотеза е вярна или невярна.
За това се използва следната формула:
Където:
-p е вероятността хипотезата да е вярна.
-q е вероятността, че не е, следователно q = 1 - p.
-E е относителната граница на грешка, например грешка от 5% има марж E = 0,05.
-Z има отношение към степента на доверие, изисквана от изследването.
При стандартизирано (или нормализирано) нормално разпределение нивото на доверие от 90% има Z = 1,645, тъй като вероятността резултатът да е между -1 645σ и + 1645σ е 90%, където σ е стандартното отклонение,
Нива на увереност и съответните им Z стойности
1.- 50% ниво на доверие съответства на Z = 0.675.
2.- 68.3% ниво на доверие съответства на Z = 1.
3.- 90% ниво на доверие е еквивалентно на Z = 1645.
4.- 95% ниво на доверие съответства на Z = 1,96
5.- 95.5% ниво на доверие съответства на Z = 2.
6.- 99.7% ниво на доверие е еквивалентно на Z = 3.
Пример, при който тази формула може да се приложи, е в проучване за определяне на средното тегло на камъчета на плаж.
Ясно е, че не е възможно да се изследват и претеглят всички камъчета на плажа, така че е удобно да се извади проба възможно най-случайно и с подходящ брой елементи.
Фигура 2. За да се проучат характеристиките на камъчетата на плаж, е необходимо да се избере произволна проба с представителен брой от тях. (Източник: pixabay)
Случай 2: размерът на населението е известен
Когато е известен броят N на елементите, съставляващи определена популация (или вселена), ако искаме чрез просто произволно изваждане да избираме статистически значима извадка с размер n, това е формулата:
Където:
-Z е коефициентът, свързан с нивото на доверие.
-p е вероятността за успех на хипотезата.
-q е вероятността за неуспех в хипотезата, p + q = 1.
-N е размерът на общото население.
-Е е относителната грешка на резултата от изследването.
Примери
Методиката за извличане на пробите зависи много от вида на изследването, което трябва да се направи. Следователно, случайното вземане на проби има безкраен брой приложения:
Проучвания и въпросници
Например при телефонни анкети хората, които ще бъдат консултирани, се избират чрез генератор на произволни числа, приложим за изследвания регион.
Ако искате да приложите въпросник към служителите на голяма компания, тогава можете да прибегнете до подбора на респондентите чрез техния номер на служител или номер на лична карта.
Споменатото число също трябва да бъде избрано произволно, като се използва например генератор на произволни числа.
Фигура 3. Въпросник може да бъде приложен чрез произволен избор на участниците. Източник: Pixabay
QA
В случай, че изследването е върху части, произведени от машина, частите трябва да бъдат избрани на случаен принцип, но от партиди, произведени в различно време на деня или в различни дни или седмици.
предимство
Проста случайна извадка:
- Това позволява намаляване на разходите за статистическо проучване, тъй като не е необходимо да се изследва общото население, за да се получат статистически надеждни резултати, с желаните нива на увереност и нивото на грешка, изисквани в проучването.
- Избягвайте пристрастия: тъй като изборът на елементите, които ще бъдат изследвани, е напълно случаен, проучването вярно отразява характеристиките на популацията, въпреки че е проучена само част от нея.
Недостатъци
- Методът не е адекватен в случаите, когато искате да знаете предпочитанията в различни групи или слоеве от населението.
В този случай е за предпочитане предварително да се определят групите или сегментите, върху които трябва да се проведе изследването. След като слоевете или групите са дефинирани, тогава, ако е удобно за всяка една от тях да се приложи случайно вземане на проби.
- Малко вероятно е да се получи информация за малцинствените сектори, от които понякога е необходимо да се знаят техните характеристики.
Например, ако става въпрос за кампания за скъп продукт, е необходимо да се знаят предпочитанията на най-богатите малцинствени сектори.
Упражнението е разрешено
Искаме да проучим предпочитанията на населението към определена напитка с кола, но няма предишно проучване при тази популация, чийто размер не е известен.
От друга страна, извадката трябва да бъде представителна с минимално ниво на доверие от 90%, а изводите трябва да имат процентна грешка от 2%.
-Как да определим размера n на пробата?
-Какъв би бил размерът на извадката, ако грешката се направи по-гъвкава до 5%?
Решение
Тъй като размерът на популацията е неизвестен, формулата, дадена по-горе, се използва за определяне на размера на извадката:
n = (Z 2 p q) / (E 2)
Предполагаме, че съществува еднаква вероятност за предпочитание (p) за нашата марка безалкохолни напитки спрямо не-предпочитанията (q), така че p = q = 0,5.
От друга страна, тъй като резултатът от изследването трябва да има процентна грешка, по-малка от 2%, тогава относителната грешка Е ще бъде 0,02.
И накрая, Z стойност = 1645 създава ниво на доверие от 90%.
Обобщавайки, имаме следните стойности:
Z = 1645
р = 0,5
q = 0,5
Е = 0,02
С тези данни се изчислява минималният размер на извадката:
п = (1.645 2 0.5 0.5) / (0.02 2) = 1691.3
Това означава, че изследването с необходимата граница на грешка и с избраното ниво на доверие трябва да има извадка от респонденти от поне 1692 индивида, избрани чрез обикновена случайна извадка.
Ако преминете от граница на грешка от 2% до 5%, тогава новият размер на извадката е:
n = (1.645 2 0.5 0.5) / (0.05 2) = 271
Което е значително по-малък брой индивиди. В заключение, размерът на извадката е много чувствителен към желаната граница на грешка в изследването.
Препратки
- Berenson, M. 1985. Статистика за управление и икономика, концепции и приложения. Редакция Interamericana.
- Статистика. Случайно вземане на проби. Взета от: encyclopediaeconomica.com.
- Статистика. Вземане на проби. Възстановено от: Estadistica.mat.uson.mx.
- Explorable. Случайно вземане на проби. Възстановено от: explorable.com.
- Moore, D. 2005. Приложна основна статистика. 2-ри. Edition.
- Netquest. Случайно вземане на проби. Възстановена от: netquest.com.
- Wikipedia. Статистическа извадка. Възстановено от: en.wikipedia.org