- Честотно разпределение
- Колко класове да вземете предвид?
- Как се получава?
- пример
- За какво е?
- пример
- Препратки
В знак клас, известен също като средната точка, е стойността в центъра на един клас, който представлява всички стойности, които са в тази категория. По принцип марката клас се използва за изчисляване на определени параметри, като средноаритметичното или стандартното отклонение.
Така че класната марка е средната точка на всеки интервал. Тази стойност е много полезна и за намиране на дисперсията на набор от данни, вече групирани в класове, което от своя страна ни позволява да разберем колко далеч от центъра се намират тези конкретни данни.
Честотно разпределение
За да разберем какво е марка клас, е необходима концепцията за разпределение на честотата. Като се има предвид набор от данни, честотното разпределение е таблица, която разделя данните на няколко категории, наречени класове.
Тази таблица показва броя на елементите, които принадлежат на всеки клас; последният е известен като честота.
Тази таблица жертва част от информацията, която получаваме от данните, тъй като вместо да имаме индивидуалната стойност на всеки елемент, ние знаем само, че тя принадлежи към този клас.
От друга страна, ние получаваме по-добро разбиране на набора от данни, тъй като по този начин е по-лесно да оценим установените модели, което улеснява манипулирането на споменатите данни.
Колко класове да вземете предвид?
За да извършим честотно разпределение, първо трябва да определим броя класове, които искаме да поемем, и да изберем техните класови граници.
Изборът колко класове да вземем трябва да бъде удобен, като се вземе предвид, че малък брой класове могат да скрият информация за данните, които искаме да проучим, а много голям може да генерира твърде много подробности, които не са непременно полезни.
Факторите, които трябва да вземем предвид, когато избираме колко класове да вземем, са няколко, но сред тези два се открояват: първият е да вземем предвид колко данни трябва да вземем предвид; второто е да се знае колко голям е обхватът на разпределението (тоест разликата между най-голямото и най-малкото наблюдение).
След като вече са дефинирани класовете, продължаваме да броим колко данни има във всеки клас. Това число се нарича честотата на класовете и се обозначава с фи.
Както бяхме казали по-рано, имаме, че честотното разпределение губи информацията, която идва индивидуално от всяка информация или наблюдение. Поради тази причина се търси стойност, която представлява целия клас, към който принадлежи; тази стойност е класната марка.
Как се получава?
Класната марка е основната стойност, която клас представлява. Получава се чрез добавяне на границите на интервала и разделяне на тази стойност на две. Можем да изразим това математически по следния начин:
x i = (долна граница + горна граница) / 2.
В този израз x i обозначава маркировката на i клас.
пример
Като се има предвид следният набор от данни, дайте представително честотно разпределение и вземете съответната марка клас.
Тъй като данните с най-висока числова стойност са 391, а най-ниската - 221, имаме, че диапазонът е 391 -221 = 170.
Ще изберем 5 класа, всички със същия размер. Един от начините за избор на класове е следният:
Обърнете внимание, че всяка информация е в клас, те са несъвместими и имат еднаква стойност. Друг начин за избор на класове е като се разглеждат данните като част от непрекъсната променлива, която може да достигне всяка реална стойност. В този случай можем да разгледаме класове от формата:
205-245, 245-285, 285-325, 325-365, 365-405
Този начин на групиране на данни обаче може да представи някои неясноти с границите. Например в случай на 245 възниква въпросът: към кой клас принадлежи, първият или вторият?
За да се избегне това объркване, се прави конвенция за крайната точка. По този начин първият клас ще бъде интервалът (205,245], вторият (245,285] и т.н.)
След като класовете са дефинирани, пристъпваме към изчисляване на честотата и имаме следната таблица:
След получаване на честотното разпределение на данните, пристъпваме към намирането на класните марки на всеки интервал. В действителност трябва да:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
Можем да представим това със следната графика:
За какво е?
Както бе споменато по-горе, класната марка е много функционална за намиране на средноаритметичната стойност и дисперсията на група данни, които вече са групирани в различни класове.
Можем да определим аритметичната средна стойност като сума от получените наблюдения между размера на извадката. От физическа гледна точка, неговата интерпретация е като равновесната точка на набор от данни.
Идентифицирането на цял набор от данни с едно число може да бъде рисковано, така че разликата между тази точка на разбиване и реалните данни също трябва да се вземе предвид. Тези стойности са известни като отклонение от средноаритметичната стойност и с тях се стремим да определим колко варира средното аритметично на данните.
Най-разпространеният начин за намиране на тази стойност е чрез дисперсия, която е средната стойност на квадратите на отклоненията от средната аритметика.
За да изчислим средната аритметика и дисперсията на набор от данни, групирани в клас, използваме съответно следните формули:
В тези изрази x i е i-тият клас марка, f i представлява съответната честота и k броя на класовете, в които са групирани данните.
пример
Използвайки данните, дадени в предишния пример, имаме, че можем да разширим малко повече данните от таблицата за честотно разпределение. Получавате следното:
След това, замествайки данните във формулата, ни остава средното аритметично като:
Отклонението и стандартното му отклонение са:
От това можем да заключим, че първоначалните данни имат средноаритметична стойност 306,6 и стандартно отклонение 39,56.
Препратки
- Фернандес Ф. Сантяго, Кордоба Л. Алехандро, Кордеро С. Хосе М. Описателна статистика. Esic редакция.
- Джонсън Ричард А. Милър и Фройд Вероятност и държавници за инженери.
- Miller I & Freund J. Вероятност и държавници за инженери. REVERT.
- Сарабия А. Хосе Мария, Паскуал Марта. Основен курс по статистика за компании
- Llinás S. Humberto, Rojas A. Carlos Описателна статистика и разпределение на вероятностите, Universidad del Norte