- Видове степени на свобода
- В механичен случай
- В набор от случайни стойности
- Примери
- Разнообразие и степени на свобода
- В разпределението на квадрат Чи
- В теста на хипотезата (С решен пример)
- Препратки
Степента на свобода в статистиката е броят на независимите компоненти на случаен вектор. Ако векторът има n компоненти и има p линейни уравнения, свързани с неговите компоненти, тогава степента на свобода е np.
Понятието за степени на свобода се появява и в теоретичната механика, където те са приблизително еквивалентни на измерението на пространството, където се движи частицата, минус броя на връзките.
Фигура 1. Махалото се движи в две измерения, но има само една степен на свобода, защото е принудено да се движи в дъга с радиус L. Източник: Ф. Сапата.
Тази статия ще обсъди концепцията за степените на свобода, приложени към статистиката, но механичният пример е по-лесен за визуализация в геометрична форма.
Видове степени на свобода
В зависимост от контекста, в който се прилага, начинът за изчисляване на броя степени на свобода може да варира, но основната идея винаги е една и съща: общи размери, по-малък брой ограничения.
В механичен случай
Нека разгледаме осцилираща частица, вързана към низ (махало), който се движи във вертикалната равнина xy (2 измерения). Частицата обаче е принудена да се движи по обиколката на радиус, равна на дължината на акорда.
Тъй като частицата може да се движи само по тази крива, броят на степените на свобода е 1. Това може да се види на фигура 1.
Начинът за изчисляване на броя степени на свобода е чрез вземане на разликата в броя на размерите минус броя на ограниченията:
степени на свобода: = 2 (размери) - 1 (лигатура) = 1
Друго обяснение, което ни позволява да стигнем до резултата, е следното:
-Значим, че позицията в две измерения е представена от точка от координати (x, y).
-Но тъй като точката трябва да съответства на уравнението на обиколката (x 2 + y 2 = L 2) за дадена стойност на променливата x, променливата y се определя от споменатото уравнение или ограничение.
По този начин само една от променливите е независима и системата има една (1) степен на свобода.
В набор от случайни стойности
За да илюстрираме какво означава концепцията, да предположим вектора
x = (x 1, x 2,…, x n)
Представяне на извадката от n нормално разпределени случайни стойности. В този случай случайният вектор x има n независими компоненти и следователно x се казва, че има n степени на свобода.
Нека сега построим вектора r на остатъците
r = (x 1 -
Където
Така че сумата
(x 1 -
Това е уравнение, което представлява ограничение (или свързване) в елементите на вектора r на остатъците, тъй като ако n-1 компонентите на вектора r са известни, рестрикционното уравнение определя неизвестния компонент.
Следователно вектор r на измерение n с ограничението:
∑ (x i -
Той има (n - 1) степени на свобода.
Отново се прилага, че изчисляването на броя степени на свобода е:
степени на свобода: = n (размери) - 1 (ограничения) = n-1
Примери
Разнообразие и степени на свобода
Отклонението s 2 се определя като средната стойност на квадрата на отклоненията (или остатъците) на извадката от n данни:
s 2 = (r • r) / (n-1)
където r е векторът на остатъците r = (x1 -
s 2 = ∑ (x i -
Във всеки случай трябва да се отбележи, че когато се изчислява средната стойност на квадрата на остатъците, тя се дели на (n-1), а не на n, тъй като както е обсъдено в предишния раздел, броят на степените на свобода на вектора r е (п-1).
Ако за изчисляването на дисперсията тя беше разделена на n вместо на (n-1), резултатът би имал отклонение, което е много значително за стойности n по-малки от 50.
В литературата формулата на дисперсията също се появява с делителя n вместо (n-1), когато става дума за дисперсията на съвкупност.
Но наборът от случайната променлива на остатъците, представен от вектора r, въпреки че има измерение n, има само (n-1) степени на свобода. Ако обаче броят на данните е достатъчно голям (n> 500), и двете формули се сближават до един и същ резултат.
Калкулаторите и електронните таблици предоставят както версии на дисперсията, така и стандартното отклонение (което е квадратният корен на дисперсията).
Нашата препоръка, с оглед на анализа, представен тук, е винаги да избирате версията с (n-1) всеки път, когато е необходимо да се изчисли отклонението или стандартното отклонение, за да се избегнат предубедени резултати.
В разпределението на квадрат Чи
Някои разпределения на вероятността в непрекъсната случайна променлива зависят от параметър, наречен степен на свобода, това е случаят с разпределението на Chi-квадрата (χ 2).
Името на този параметър идва точно от степените на свобода на основния случаен вектор, към който се прилага това разпределение.
Да предположим, че имаме g популации, от които са взети проби с размер n:
X 1 = (x1 1, x1 2,…..x1 n)
X2 = (x2 1, x2 2,…..x2 n)
….
X j = (xj 1, xj 2,…..xj n)
….
Xg = (xg 1, xg 2,…..xg n)
Население j, което има средна стойност
Стандартизираната или нормализирана променлива zj i се дефинира като:
zj i = (xj i -
И векторът Zj е дефиниран така:
Zj = (zj 1, zj 2,…, zj i,…, zj n) и следва стандартизираното нормално разпределение N (0,1).
Значи променливата:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
следва разпределението на χ 2 (g), наречено хи-квадратно разпределение със степен на свобода g.
В теста на хипотезата (С решен пример)
Когато искате да тествате хипотези въз основа на определен набор от случайни данни, трябва да знаете броя на степените на свобода g, за да приложите теста на Chi-квадрат.
Фигура 2. Съществува ли връзка между предпочитанието на сладоледа FLAVOR и джендъра на клиента? Източник: Ф. Сапата.
Като пример ще бъдат анализирани данните, събрани за предпочитанията на шоколадов или ягодов сладолед сред мъже и жени в определен салон за сладолед. Честотата, с която мъжете и жените избират ягоди или шоколад, е обобщена на фигура 2.
Първо се изчислява таблицата на очакваните честоти, която се подготвя чрез умножаване на общия брой редове по общия брой колони, разделен на общите данни. Резултатът е показан на следната фигура:
Фигура 3. Изчисляване на очакваните честоти въз основа на наблюдаваните честоти (стойности в синьо на фигура 2). Източник: Ф. Сапата.
Тогава квадратът Chi се изчислява (от данните) по следната формула:
χ 2 = ∑ (F o - F e) 2 / F e
Където F o са наблюдаваните честоти (Фигура 2) и F e са очакваните честоти (Фигура 3). Обобщението преминава през всички редове и колони, които в нашия пример дават четири термина.
След извършване на операциите получавате:
χ 2 = 0,2043.
Сега е необходимо да се сравни с теоретичния квадрат Chi, който зависи от броя на степените на свобода g.
В нашия случай това число се определя, както следва:
g = (# редове - 1) (# колони - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Оказва се, че броят на градусите на свобода g в този пример е 1.
Ако искате да проверите или отхвърлите нулевата хипотеза (H0: няма връзка между TASTE и GENDER) с ниво на значимост 1%, теоретичната стойност на Chi-квадрата се изчислява със степен на свобода g = 1.
Търсена е стойността, която прави натрупаната честота (1 - 0,01) = 0,99, тоест 99%. Тази стойност (която може да бъде получена от таблиците) е 6 636.
Тъй като теоретичният Chi надвишава изчислената, тогава нулевата хипотеза се проверява.
С други думи, при събраните данни не се наблюдава връзка между променливите TASTE и GENDER.
Препратки
- Minitab. Какви са степените на свобода? Възстановена от: support.minitab.com.
- Мур, Дейвид. (2009) Основна приложна статистика. Антони Бош редактор.
- Лий, Дженифър. Как да изчислим степените на свобода в статистическите модели. Възстановено от: geniolandia.com
- Wikipedia. Степен на свобода (статистика). Възстановено от: es.wikipedia.com
- Wikipedia. Степен на свобода (физическа). Възстановено от: es.wikipedia.com