- Групирани данни
- пример
- 3 основни мерки на централната тенденция
- 1- Аритметична средна стойност
- 2- среден
- 3- Мода
- Препратки
В мерките на централната тенденция на групирани данни се използват в областта на статистиката, за да опише определени поведения на група, предоставени данни, като например каква стойност те са близо до това, което е средната стойност на събраните данни, между другото.
Когато вземате голямо количество данни, е полезно да ги групирате, за да имате по-добър ред от тях и по този начин да можете да изчислите определени мерки от централна тенденция.
Сред най-широко използваните мерки с централна тенденция са средноаритметичната, средната и модната. Тези числа показват определени качества за данните, събрани в определен експеримент.
За да използвате тези мерки, първо трябва да знаете как да групирате набор от данни.
Групирани данни
За да групирате данни, първо трябва да изчислите обхвата на данните, който се получава чрез изваждане на най-високата стойност минус най-ниската стойност на данните.
Тогава се избира число "k", което е броят класове, в които искаме да групираме данните.
Диапазонът е разделен на "k", за да се получи амплитудата на класовете, които ще бъдат групирани. Това число е C = R / k.
Накрая започва групирането, за което се избира число, по-малко от най-ниската стойност на получените данни.
Това число ще бъде долната граница на първия клас. Към това се добавя С. Получената стойност ще бъде горната граница на първия клас.
След това към тази стойност се добавя C и се получава горната граница на втория клас. По този начин пристъпваме към получаване на горната граница на последния клас.
След групирането на данните може да се изчисли средната, средната и режимът.
За да илюстрираме как се изчисляват средната аритметика, медиана и режим, ще продължим с пример.
пример
Следователно, когато групирате данните, ще се получи таблица като следната:
3 основни мерки на централната тенденция
Сега ще пристъпим към изчисляване на средната аритметика, медианата и режима. Примерът по-горе ще бъде използван за илюстриране на тази процедура.
1- Аритметична средна стойност
Аритметичната средна стойност се състои в умножаване на всяка честота по средната стойност на интервала. След това се добавят всички тези резултати и накрая тя се разделя на общите данни.
Използвайки предишния пример, би се получило, че средната аритметична стойност е равна на:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Това показва, че средната стойност на данните в таблицата е 5.11111.
2- среден
За да изчислим медианата на набор от данни, първо нареждаме всички данни от най-малко до най-голямо. Могат да възникнат два случая:
- Ако броят на данните е нечетен, то средната е данните, които са точно в центъра.
- Ако броят на данните е четен, то средната е средната стойност на двете данни, които са в центъра.
Когато става въпрос за групирани данни, изчисляването на медианата се извършва по следния начин:
- N / 2 се изчислява, където N е общата информация.
- Търси се първият интервал, при който натрупаната честота (сумата от честотите) е по-голяма от N / 2 и се избира долната граница на този интервал, наречена Li.
Медианата се дава по следната формула:
Me = Li + (Ls-Li) * (N / 2 - натрупана честота преди Li) / честота на [Li, Ls)
Ls е горната граница на посочения по-горе интервал.
Ако се използва предишната таблица с данни, N / 2 = 18/2 = 9. Натрупаните честоти са 4, 8, 14 и 18 (по една за всеки ред от таблицата).
Следователно трябва да бъде избран третият интервал, тъй като кумулативната честота е по-голяма от N / 2 = 9.
Значи Li = 5 и Ls = 7. Прилагайки описаната по-горе формула, трябва да:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3- Мода
Режимът е стойността, която има най-високата честота сред всички групирани данни; това е стойността, която се повтаря най-много пъти в първоначалния набор от данни.
Когато имате много голям обем данни, за изчисляване на режима на групираните данни се използва следната формула:
Mo = Li + (Ls-Li) * (честота на Li - честота на L (i-1)) / ((честота на Li - честота на L (i-1)) + (честота на Li - честота на L (i + 1)))
Интервалът [Li, Ls] е интервалът, на който се намира най-високата честота. За примера, направен в тази статия, режимът е даден от:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Друга формула, която се използва за получаване на приблизителна стойност на режима, е следната:
Mo = Li + (Ls-Li) * (честота L (i + 1)) / (честота L (i-1) + честота L (i + 1)).
С тази формула сметките са както следва:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Препратки
- Bellhouse, DR (2011). Abraham De Moivre: Определяне на сцената за класическата вероятност и нейните приложения. CRC Press.
- Cifuentes, JF (2002). Въведение в теорията на вероятността. Национален университет в Колумбия.
- Daston, L. (1995). Класическа вероятност в Просвещението. Princeton University Press.
- Larson, HJ (1978). Въведение в теорията на вероятностите и статистическите изводи. Редакторска лимуза.
- Martel, PJ, & Vegas, FJ (1996). Вероятност и математическа статистика: приложения в клиничната практика и управление на здравето. Издания на Díaz de Santos.
- Vázquez, AL, & Ortiz, FJ (2005). Статистически методи за измерване, описание и контрол на променливостта. Ред. Университет в Кантабрия.
- Vázquez, SG (2009). Ръководство по математика за достъп до университета. Редакция Centro de Estudios Ramon Areces SA.