- Формули и уравнения
- Как да изчислим грешката в извадката
- За ниво на увереност
- Примери
- - Пример 1
- Решение
- - Пример 2
- Решение
- - Пример 3
- Решение
- - Пример 4
- Решение
- - Упражнение 5
- Решение
- Препратки
В извадки грешката или вземане на проби грешка в статистиката е разликата между средната стойност на проба и средната стойност на общия брой на населението. За да илюстрираме идеята, нека си представим, че общото население на един град е един милион души, от които искате средният му размер на обувките, за който се взема случайна извадка от хиляда души.
Средният размер, който излиза от извадката, не е задължително да съвпада с този на общата популация, въпреки че, ако извадката не е предубедена, стойността трябва да е близка. Тази разлика между средната стойност на извадката и тази на общата популация е грешката в извадката.
Фигура 1. Тъй като извадката е подмножество от общата съвкупност, средната проба има граница на грешка. Източник: Ф. Сапата.
Като цяло средната стойност на общата съвкупност е неизвестна, но има техники за намаляване на тази грешка и формули за оценка на границата на грешката на извадката, която ще бъде разгледана в тази статия.
Формули и уравнения
Да кажем, че искаме да знаем средната стойност на определена измерима характеристика x в популация с размер N, но тъй като N е голямо число, не е възможно да се извърши изследването върху общата популация, тогава ще пристъпим към вземане на произволна извадка от размер n <
Средната стойност на пробата се обозначава с
Да предположим, че m проби са взети от общата популация N, всички с равен размер n със средни стойности
Тези средни стойности няма да бъдат еднакви помежду си и всички ще бъдат около средната стойност на населението μ. Маржът на грешката в извадката E показва очакваното разделяне на средните стойности
Стандартният марж на грешка ε на извадката с размер n е:
ε = σ / √n
където σ е стандартното отклонение (квадратният корен на дисперсията), което се изчислява по следната формула:
σ = √
Значението на стандартния марж на грешка ε е следното:
Средна стойност
Как да изчислим грешката в извадката
В предишния раздел беше дадена формулата за намиране на стандартния марж на грешка на извадка с размер n, където думата стандарт показва, че това е граница на грешка с 68% доверие.
Това показва, че ако са взети много проби с един и същ размер n, 68% от тях ще дадат средни стойности
Съществува просто правило, наречено правило 68-95-99.7, което ни позволява лесно да намерим граница на грешка в извадката E за нива на доверие от 68%, 95% и 99,7%, тъй като този марж е 1⋅ ε, 2 ⋅ ε и 3⋅ ε съответно.
За ниво на увереност
Ако нивото на достоверност γ не е едно от горните, тогава грешката в извадката е стандартното отклонение σ, умножено по коефициента Zγ, което се получава по следната процедура:
1.- Първо се определя нивото на значимост α, което се изчислява от нивото на доверие γ чрез следното съотношение: α = 1 - γ
2.- След това трябва да изчислим стойността 1 - α / 2 = (1 + γ) / 2, която съответства на натрупаната нормална честота между -∞ и Zγ, в нормално или гаусско разпределение, типизирано F (z), чието определение може да се види на фигура 2.
3.- Уравнението F (Zγ) = 1 - α / 2 се решава с помощта на таблиците с нормалното разпределение (кумулативно) F или с помощта на компютърно приложение, което има обратната гаусска функция F -1.
В последния случай имаме:
Zγ = G -1 (1 - α / 2).
4.- И накрая, тази формула се прилага за грешка в извадката с ниво на надеждност γ:
E = Zγ ⋅ (σ / √n)
Фигура 2. Таблица на нормалното разпределение. Източник: Wikimedia Commons.
Примери
- Пример 1
Изчислете стандартния марж на грешка в средното тегло на проба от 100 новородени. Изчисляването на средното тегло беше
Решение
Стандартната граница на грешка е ε = σ / √n = (1500 кг) / √100 = 0,15 кг. Това означава, че с тези данни може да се заключи, че теглото на 68% от новородените е между 2950 кг и 3,25 кг.
- Пример 2
Определете граница на вземане на проби от грешка E и диапазона на теглото на 100 новородени с 95% ниво на доверие, ако средното тегло е 3100 kg със стандартно отклонение σ = 1500 kg.
Решение
Ако важи правило 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, имаме:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
С други думи, 95% от новородените ще имат тегло между 2800 кг и 3400 кг.
- Пример 3
Определете обхвата на теглата на новородените в Пример 1 с марж на достоверност от 99,7%.
Решение
Грешката в извадката с 99,7% надеждност е 3 σ / √n, което за нашия пример е E = 3 * 0,15 kg = 0,45 kg. Оттук следва, че 99,7% от новородените ще имат тежести между 2650 кг и 3,550 кг.
- Пример 4
Определете фактора Zγ за ниво на доверие от 75%. Определете границата на грешката на извадката с това ниво на надеждност за случая, представен в Пример 1.
Решение
Нивото на доверие е γ = 75% = 0,75, което е свързано с нивото на значимост α чрез връзката γ = (1 - α), така че нивото на значимост е α = 1 - 0,75 = 0, 25.
Това означава, че кумулативната нормална вероятност между -∞ и Zγ е:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Което съответства на Zγ стойност от 1.1503, както е показано на фигура 3.
Фигура 3. Определяне на коефициента Zγ, съответстващ на ниво на доверие от 75%. Източник: Ф. Сапата през Геогебра.
С други думи, грешката на извадката е E = Zγ ⋅ (σ / √n) = 1.15 ⋅ (σ / √n).
Когато се прилага към данните от пример 1, тя дава грешка от:
Е = 1,15 * 0,15 кг = 0,17 кг
С ниво на доверие от 75%.
- Упражнение 5
Какво е нивото на доверие, ако Z α / 2 = 2.4?
Решение
P (Z ≤ Z α / 2) = 1 - α / 2
P (Z ≤ 2.4) = 1 - α / 2 = 0.9918 → α / 2 = 1 - 0.9918 = 0.0082 → α = 0.0164
Нивото на значимост е:
α = 0,0164 = 1,64%
И накрая, нивото на доверие остава:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Препратки
- Canavos, G. 1988. Вероятност и статистика: Приложения и методи. McGraw Hill.
- Devore, J. 2012. Вероятност и статистика за инженерство и наука. 8-ми. Edition. Cengage.
- Levin, R. 1988. Статистика за администраторите. 2-ри. Edition. Prentice Hall.
- Sudman, S. 1982. Задаване на въпроси: Практическо ръководство за проектиране на въпросници. Сан Франциско. Джоси Бас.
- Walpole, R. 2007. Вероятност и статистика за инженерни науки. Пиърсън.
- Wonnacott, TH и RJ Wonnacott. 1990. Уводна статистика. 5-ти изд. Уайли
- Wikipedia. Грешка в извадката. Възстановено от: en.wikipedia.com
- Wikipedia. Погрешка. Възстановено от: en.wikipedia.com