Тестът Tukey е метод, който има за цел да сравни отделните средства от анализ на дисперсия на няколко проби, подложени на различни обработки.
Тестът, представен през 1949 г. от John.W. Tukey, ни позволява да разберем дали получените резултати са значително различни или не. Известен е и като честно значимата разлика на Tukey (Hkey-тест на Tukey).
Фигура 1. Тестът Tukey ни позволява да установим дали разликите в резултатите между три или повече различни лечения, прилагани за три или повече групи със същите характеристики, имат значително и честно различни средни стойности.
При експерименти, при които се сравняват три или повече различни обработки, прилагани към един и същ брой проби, е необходимо да се установи дали резултатите са значително различни или не.
Казват, че експериментът е балансиран, когато размерът на всички статистически проби е един и същ за всяко третиране. Когато размерът на пробите е различен за всяко третиране, тогава се провежда небалансиран експеримент.
Понякога с анализ на дисперсията (ANOVA) не е достатъчно да се знае дали при сравнението на различни лечения (или експерименти), прилагани към няколко проби, те изпълняват нулевата хипотеза (Ho: „всички лечения са равни“) или, напротив, изпълнява алтернативната хипотеза (Ha: „поне едно от леченията е различно“).
Тестът на Tukey не е уникален, има много повече тестове за сравняване на примерни средства, но това е едно от най-известните и прилагани.
Tukey сравнение и маса
При прилагането на този тест се изчислява стойност w, наречена Tukey сравнение, чието определение е както следва:
w = q √ (MSE / r)
Когато фактор q е получен от таблица (Tukey's Table), която се състои от редове от q стойности за различен брой лечения или експерименти. Колоните показват стойността на фактор q за различни степени на свобода. Обикновено наличните таблици имат относително значение от 0,05 и 0,01.
В тази формула в квадратния корен се появява коефициентът MSE (Среден квадрат на грешката), разделен на r, който показва броя на повторенията. MSE е число, което обикновено се получава от анализ на дисперсии (ANOVA).
Когато разликата между две средни стойности надвишава стойността w (Tukey сравнение), тогава се заключава, че те са различни средни стойности, но ако разликата е по-малка от числото Tukey, то това е две проби със статистически идентична средна стойност,
Числото w е известно още като HSD (Честно значима разлика) число.
Това единично сравнително число може да се приложи, ако броят на пробите, приложени за теста на всяко третиране, е един и същ във всяка от тях.
Небалансирани експерименти
Когато по някаква причина размерът на пробите е различен при всяко третиране, което трябва да се сравнява, тогава описаната по-горе процедура се различава леко и е известна като тест на Тукей-Крамер.
Сега се получава число за сравнение w за всяка двойка обработки i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
В тази формула фактор q се получава от таблицата на Туки. Този фактор q зависи от броя на леченията и степента на свобода на грешката. r i е броят повторения в лечението i, докато r j е броят на повторенията в лечението j.
Примерен случай
Развъдчик на зайци иска да направи надеждно статистическо проучване, което му казва коя от четирите марки храни за угояване на зайци е най-ефективната. За изследването той сформира четири групи с шест зайци на един месец и половина, които дотогава са имали същите условия на хранене.
Причините бяха, че в групи А1 и А4 смъртни случаи настъпиха поради причини, които не се дължат на храната, тъй като единият от зайците е бил ухапан от насекомо, а в другия случай смъртта със сигурност е била причина за вроден дефект. Така че групите са неуравновесени и тогава е необходимо да се приложи тестът Tukey-Kramer.
Упражнението е разрешено
За да не се удължават прекалено дълго изчисленията, балансиран експериментален случай ще бъде взет като решено упражнение. Следните ще бъдат взети като данни:
В този случай има четири групи, съответстващи на четири различни лечения. Ние обаче наблюдаваме, че всички групи имат еднакъв брой данни, така че това е балансиран случай.
За извършване на анализа ANOVA е използван инструментът, който е включен в електронната таблица Libreoffice. Други електронни таблици като Excel включват този инструмент за анализ на данни. По-долу е обобщена таблица, получена след анализ на дисперсията (ANOVA):
От анализа на дисперсията имаме и стойността Р, която например е 2,24Е-6, много под нивото на значимост 0,05, което директно води до отхвърляне на нулевата хипотеза: Всички лечения са равни.
Тоест, сред леченията, някои имат различни средни стойности, но е необходимо да се знае кои са статистически значимите и честно различни (HSD), използвайки теста Tukey.
За да намерим числото wo, тъй като HSD номерът също е известен, трябва да намерим средния квадрат на грешката MSE. От ANOVA анализа се получава, че сборът от квадрати в групите е SS = 0,2; и броят на степените на свобода в групите е df = 16 с тези данни можем да намерим MSE:
MSE = SS / df = 0.2 / 16 = 0.0125
Необходимо е също така да се намери коефициентът на Tukey q, като се използва таблицата. Колона 4, която съответства на 4-те групи или лечения, които трябва да бъдат сравнени, и ред 16 се търсят, тъй като анализът ANOVA даде 16 градуса свобода в рамките на групите. Това ни води до стойност на q, равна на: q = 4.33, съответстваща на 0,05 значимост или 95% надеждност. Най-накрая се открива стойността за „честно значимата разлика“:
w = HSD = q √ (MSE / r) = 4.33 √ (0.0125 / 5) = 0.2165
За да знаете кои са честно различните групи или лечения, трябва да знаете средните стойности на всяко лечение:
Необходимо е също така да се знаят разликите между средните стойности на двойки лечения, което е показано в следната таблица:
Заключено е, че най-добрите лечения, от гледна точка на максимизиране на резултата, са Т1 или Т3, които са безразлични от статистическа гледна точка. За да изберете между T1 и T3, трябва да се търсят други фактори извън анализа, представен тук. Например цена, наличност и т.н.
Препратки
- Кохран Уилям и Кокс Гертруд. 1974. Експериментални проекти. Вършеене. Мексико. Трето преиздаване. 661p.
- Snedecor, GW и Cochran, WG 1980. Статистически методи. Седмото издание на Айова, The Iowa State University Press. 507p.
- Steel, RGD и Torrie, JH 1980. Принципи и процедури на статистиката: Биометричен подход (2-ро изд.). McGraw-Hill, Ню Йорк. 629p.
- Tukey, JW 1949. Сравняване на отделни средства при анализа на дисперсията. Биометрия, 5: 99-114.
- Wikipedia. Тест на Туки. Възстановено от: en.wikipedia.com