- Примери
- Класификация на категорични променливи
- Номинални категории
- Обикновена категорична
- Двоични категории
- Статистика с категорични променливи
- Графично представяне на категорични променливи
- Решени упражнения
- Упражнение 1
- Пример 2
- Пример 3
- Препратки
Най- категоричен променливата е този, който се използва в статистиката за присвояване на не-числов или качествена характеристика или свойство на някои обект, физическо лице, юридическо лице, състояние или процедура. Възможно е да се дефинират всички видове категорични променливи според всяка нужда.
Примери за категорични променливи са: цвят, пол, кръвна група, семейно положение, вид материал, начин на плащане или вид банкова сметка и те се използват много ежедневно.
Фигура 1: Цветът е категорична променлива. Източник: pixabay
Горните са променливите, но техните възможни стойности са качествени, тоест с качество или характеристики, а не с числово измерване. Например възможните стойности за променливия пол са: мъж, h embra.
Когато тази променлива се съхранява в компютърна програма, тя може да бъде декларирана като текстова променлива и единствените приети стойности ще бъдат тези, които вече са именувани: Мъж, Жена.
Въпреки това, един и същ променлив пол може да бъде деклариран и съхранен като цяло число, ако мъжът е присвоен 1, а на женския е присвоена стойността 2. Поради тази причина категоричните променливи понякога се наричат изброен тип.
Основната характеристика на категоричните променливи е, че за разлика от други променливи, като непрекъснати и дискретни променливи, не е възможно да се прави аритметика с тях. Статистиката обаче може да се направи с тях, както ще се види по-нататък.
Примери
Обърнете внимание на следните примери за категорични променливи и техните възможни стойности:
- Group_Sanguíneo, Диапазон от стойности: A, B, AB, O
- Civil_Status, Категорични стойности: Единична (A), Женена (B), Вдовица (C), Разведена (D).
- Tipo_de_Material, категории или стойности: 1 = дърво, 2 = метал, 3 = пластмаса
-Form_of_Payment, Ценни книжа или категории: (1) Парични средства, (2) Дебитни, (3) Превод, (4) Кредитни
В предишните примери числото е свързано с всяка категория по напълно произволен начин.
Тогава може да се мисли, че тази произволна числова асоциация го прави еквивалентна на дискретна количествена променлива, но не е така, тъй като аритметичните операции не могат да се правят с тези числа.
За да илюстрира идеята, в променливата Form_of_Payment операцията за суми няма смисъл:
(1) Парични средства + (2) Дебитът никога няма да бъде равен (3) Превод
Класификация на категорични променливи
Класирането се основава на това дали те имат неявна йерархия или дали броят на възможните резултати е повече от две или две.
Категорична променлива само с един възможен резултат не е променлива, тя е категорична константа.
Номинални категории
Когато те не могат да бъдат представени с номер или имат някакъв ред. Например променливата: Type_of_Material, има номинални стойности (дърво, метал, пластмаса), те нямат йерархия или ред, дори когато на всеки отговор или категория е зададено произволно число.
Обикновена категорична
Променлива: Academic_performance
Номинални стойности: високи, средни, ниски
Въпреки че стойностите на тази променлива не са числови, те имат неявен ред или йерархия.
Двоични категории
Това са номинални променливи с два възможни отговора, например:
-Променливо: Отговор
-Номинални стойности: Вярно, невярно
Обърнете внимание, че променливата Response няма неявна йерархия и има само два възможни резултата, така че е двоична категорична променлива.
Някои автори наричат този тип двоична променлива и не смятат, че той принадлежи към категорични променливи, които са ограничени до тези с повече от три възможни категории.
Статистика с категорични променливи
Статистиката може да се прави с категорични променливи, въпреки че не са числени или количествени променливи. Например, за да се знае тенденцията или най-вероятната стойност на категорична променлива, се приема режимът.
Режимът в този случай е най-повтарящият се резултат или стойност на категорична променлива. За категорични променливи не е възможно да се изчисли нито средната, нито средната.
Средната стойност не може да бъде изчислена, защото не можете да правите аритметика с категорични променливи. Нито е средната, тъй като количествените или категоричните променливи нямат ред или йерархия, така че не е възможно да се определи централна стойност.
Графично представяне на категорични променливи
Като се има предвид определена категорична променлива, честотата или броя пъти, с които се повтаря резултат от тази променлива, може да бъде намерена. Ако това се прави за всеки резултат, тогава може да се направи графика на честотата спрямо всяка категория или резултат.
Ето няколко примера за това как категоричните променливи могат да бъдат представени графично.
Решени упражнения
Упражнение 1
Фирма има записи на данните на 170 служители. Една от променливите, която е в тези записи, е: Estado_Civil. Тази променлива има четири категории или възможни стойности:
Единичен (A), женен (B), овдовял (C), разведен (D).
Въпреки че е нечислена променлива, е възможно да се знае колко от общите записи са в определена категория и да бъдат представени под формата на лентова графика, както е показано на следната фигура:
Фигура 2. Представяне на резултатите от категорична променлива. Източник: самостоятелно направен
Пример 2
Магазин за обувки следи продажбите му. Сред променливите, които управляват техните записи, е цветът на обувките за всеки модел. Променливата:
Color_Shoe_Model_AW3
Той е от категоричен тип и има пет категории или възможни стойности. За всяка категория на тази променлива броят на продажбите е общо и се определя процентът на тях. Резултатите са представени в графиката на следната фигура:
Фигура 3. Категорична променлива Цвят _Шоу. В тази променлива режимът е Бял. Източник: самостоятелно направен.
Тогава може да се каже, че за модела обувки AW3, който е на мода, този, който се продава най-често, е White, следван отблизо от Black.
Може също да се каже, че с вероятност от 70% следващата обувка, която се продава на този модел, ще бъде бяла или черна.
Тази информация може да бъде полезна за магазина при подаване на нови поръчки или дори може да прилага отстъпки за най-малко продадени цветове поради излишния инвентар.
Пример 3
За определена популация от кръводарители искате да представите броя на хората, които принадлежат към определена кръвна група. Графичен начин за визуализиране на резултатите е с помощта на пиктограма, която в долната част е таблица.
Първата колона представлява променливата group_sanguíneo и нейните възможни резултати или категории. Втората колона има представяне в емблематична или изобразителна форма на броя на хората във всяка категория. В нашия пример като икона се използва червена капчица, всяка от която представлява 10 души.
Фигура 4. Пиктограма. Източник: самостоятелно направен
Препратки
- Академия Хан. Анализ на категорични данни. Възстановено от: khanacademy.org
- Формули на Вселената. Качествена променлива. Възстановено от: univesoformulas.com
- Minitab. Които са категорични, дискретни и непрекъснати променливи. Възстановена от: support.minitab.com
- Урок за Excel. Характеристика на променливи. Възстановена от: help.xlslat.com.
- Wikipedia. Статистическа променлива. Възстановено от wikipedia.com
- Wikipedia. Категорична променлива. Възстановено от wikipedia.com
- Wikipedia. Категорична променлива. Възстановено от wikipedia.com