Den Tukey testen er en metode som tar sikte på å sammenligne de individuelle midler fra en varians-analyse av flere prøver utsatt for forskjellige behandlinger.
Testen, presentert i 1949 av John.W. Tukey, lar oss skille om resultatene som er oppnådd er vesentlig forskjellige eller ikke. Det er også kjent som Tukeys ærlig signifikante forskjellstest (Tukeys HSD-test).

Figur 1. Tukey-testen gjør det mulig for oss å se om forskjellene i resultatene mellom tre eller flere forskjellige behandlinger brukt på tre eller flere grupper med samme egenskaper, har betydelig og ærlig forskjellige middelverdier.
I eksperimenter der tre eller flere forskjellige behandlinger anvendt på samme antall prøver blir sammenlignet, er det nødvendig å skille om resultatene er vesentlig forskjellige eller ikke.
Et eksperiment sies å være balansert når størrelsen på alle statistiske prøver er den samme for hver behandling. Når størrelsen på prøvene er forskjellig for hver behandling, ble det foretatt et ubalansert eksperiment.
Noen ganger er det ikke nok med en variansanalyse (ANOVA) å vite om de i sammenligningen av forskjellige behandlinger (eller eksperimenter) brukt på flere prøver oppfyller nullhypotesen (Ho: “alle behandlinger er like”), eller tvert imot, oppfyller den alternative hypotesen (Ha: "minst en av behandlingene er annerledes").
Tukey's test er ikke unik, det er mange flere tester for å sammenligne utvalgsmidler, men dette er en av de mest kjente og anvendte.
Tukey-komparator og tabell
I anvendelsen av denne testen beregnes en verdi w kalt Tukey-komparator hvis definisjon er som følger:
w = q √ (MSE / r)
Hvor faktoren q er hentet fra en tabell (Tukey's Table), som består av rader med q-verdier for forskjellige antall behandlinger eller eksperimenter. Kolonnene indikerer verdien av faktor q for forskjellige frihetsgrader. Vanligvis har de tilgjengelige tabellene en relativ betydning på 0,05 og 0,01.

I denne formelen vises innenfor kvadratroten MSE-faktoren (gjennomsnittlig firkant av feil) delt med r, som indikerer antall repetisjoner. MSE er et tall som normalt oppnås fra en variansanalyse (ANOVA).

Når forskjellen mellom to middelverdier overstiger w-verdien (Tukey-komparator), konkluderes det med at de er forskjellige gjennomsnitt, men hvis forskjellen er mindre enn Tukey-tallet, er det to prøver med statistisk identisk middelverdi .
Tallet w er også kjent som HSD-nummeret (Honestly Significant Difference).
Dette enkle komparatornummeret kan brukes hvis antall prøver som ble brukt til testen av hver behandling er det samme i hver av dem.
Ubalanserte eksperimenter
Når størrelsen på prøvene av en eller annen grunn er forskjellig i hver behandling som skal sammenlignes, skiller prosedyren beskrevet over seg litt og er kjent som Tukey-Kramer-testen.
Nå oppnås et komparatornummer w for hvert par av behandlinger i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
I denne formelen er faktoren q hentet fra Tukey's tabell. Denne faktoren q avhenger av antall behandlinger og frihetsgradene. r i er antall repetisjoner i behandling i, mens r j er antall repetisjoner i behandling j.
Eksempel
En kaninoppdretter ønsker å gjøre en pålitelig statistisk studie som forteller ham hvilket av de fire merkene med kaninoppdrettsmat som er mest effektive. For studien dannet han fire grupper med seks en og en halv måned gamle kaniner som til da hadde de samme fôringsbetingelsene.

Årsakene var at i gruppene A1 og A4 skjedde dødsfall på grunn av årsaker som ikke kan henføres til mat, siden en av kaninene ble bitt av et insekt, og i det andre tilfellet var dødsfallet sannsynligvis årsaken til en medfødt feil. Så gruppene er ubalanserte og da er det nødvendig å bruke Tukey-Kramer-testen.
Trening løst
For ikke å forlenge beregningene for lenge, vil en balansert eksperimentstilfelle bli tatt som en løst øvelse. Følgende blir tatt som data:

I dette tilfellet er det fire grupper som tilsvarer fire forskjellige behandlinger. Vi observerer imidlertid at alle gruppene har samme antall data, så det er da en balansert sak.
For å utføre ANOVA-analysen har verktøyet som er integrert i Libreoffice-regnearket blitt brukt. Andre regneark som Excel har dette verktøyet innarbeidet for dataanalyse. Nedenfor er en sammendragstabel som har resultert etter at variansanalysen (ANOVA) er utført:

Fra variansanalysen har vi også P-verdien, som for eksempelet er 2.24E-6, godt under 0,05-nivået av betydning, som direkte fører til å avvise nullhypotesen: Alle behandlinger er like.
Det er, blant behandlingene, noen har forskjellige middelverdier, men det er nødvendig å vite hvilke som er de vesentlig og ærlig forskjellige (HSD) fra det statistiske synspunktet ved hjelp av Tukey-testen.
For å finne tallet wo, som HSD-nummeret også er kjent, må vi finne middelkvadratet for feilen MSE. Fra ANOVA-analysen oppnås at summen av kvadrater i gruppene er SS = 0,2; og antall frihetsgrader i gruppene er df = 16 med disse dataene kan vi finne MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Det kreves også å finne Tukey's faktor q ved hjelp av tabellen. Kolonne 4, som tilsvarer de 4 gruppene eller behandlingene som skal sammenlignes, og rad 16 blir søkt, siden ANOVA-analysen ga 16 frihetsgrader i gruppene. Dette fører oss til en verdi på q lik: q = 4,33 tilsvarer 0,05 av betydning eller 95% av påliteligheten. Endelig blir verdien for den "ærlig signifikante forskjellen" funnet:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
For å vite hvilke ærlig forskjellige grupper eller behandlinger, må du kjenne gjennomsnittsverdiene for hver behandling:

Det er også nødvendig å kjenne til forskjellene mellom middelverdiene for behandlingspar, som er vist i følgende tabell:

Det konkluderes med at de beste behandlingene, når det gjelder å maksimere resultatet, er T1 eller T3, som er likegyldige fra et statistisk synspunkt. For å velge mellom T1 og T3, må man se etter andre faktorer utenfor analysen som presenteres her. For eksempel pris, tilgjengelighet osv.
referanser
- Cochran William og Cox Gertrude. 1974. Eksperimentelle design. Tresking. Mexico. Tredje opptrykk. 661p.
- Snedecor, GW og Cochran, WG 1980. Statistiske metoder. Syvende utgave Iowa, The Iowa State University Press. 507p.
- Steel, RGD og Torrie, JH 1980. Prinsipper og prosedyrer for statistikk: En biometrisk tilnærming (2. utg.). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Sammenligning av individuelle virkemidler i analysen av varians. Biometri, 5: 99-114.
- Wikipedia. Tukey's test. Gjenopprettet fra: en.wikipedia.com
