- Typer frihetsgrader
- I et mekanisk tilfelle
- I et sett med tilfeldige verdier
- eksempler
- Variasjon og frihetsgrader
- I Chi-torget distribusjon
- I hypotestesten (med løst eksempel)
- referanser
De frihetsgrader i statistikk er antallet uavhengige komponenter av en tilfeldig vektor. Hvis vektoren har nkomponenter og det er p lineære ligninger knyttet til dens komponenter, er frihetsgraden np.
Begrepet frihetsgrader vises også i teoretisk mekanikk, der de omtrent tilsvarer dimensjonen av rommet der partikkelen beveger seg, minus antall bindinger.

Figur 1. En pendel beveger seg i to dimensjoner, men den har bare en frihetsgrad fordi den blir tvunget til å bevege seg i en bue med radius L. Kilde: F. Zapata.
Denne artikkelen vil diskutere begrepet frihetsgrader brukt på statistikk, men et mekanisk eksempel er lettere å visualisere i geometrisk form.
Typer frihetsgrader
Avhengig av konteksten den brukes i, kan måten å beregne antall frihetsgrader variere, men den underliggende ideen er alltid den samme: totale dimensjoner minus antall begrensninger.
I et mekanisk tilfelle
La oss se på en svingende partikkel bundet til en streng (en pendel) som beveger seg i det vertikale xy-planet (2 dimensjoner). Partikelen blir imidlertid tvunget til å bevege seg på omkretsen av radius lik lengden på akkorden.
Siden partikkelen bare kan bevege seg på den kurven, er antall frihetsgrader 1. Dette kan sees i figur 1.
Måten å beregne antall frihetsgrader er ved å ta forskjellen på antall dimensjoner minus antall begrensninger:
frihetsgrader: = 2 (dimensjoner) - 1 (ligatur) = 1
En annen forklaring som gjør at vi kan nå resultatet er følgende:
-Vi vet at posisjonen i to dimensjoner er representert med et punkt med koordinater (x, y).
-Men siden punktet må samsvare med likningen av omkretsen (x 2 + y 2 = L 2 ) for en gitt verdi av variabelen x, bestemmes variabelen y av nevnte ligning eller begrensning.
På denne måten er bare en av variablene uavhengige og systemet har en (1) frihetsgrad.
I et sett med tilfeldige verdier
For å illustrere hva konseptet betyr, antar vektoren
x = (x 1 , x 2 , …, x n )
Representerer prøven av n normalt distribuerte tilfeldige verdier. I dette tilfellet har den tilfeldige vektoren x uavhengige komponenter, og derfor sies x å ha n frihetsgrader.
La oss nå konstruere vektoren r for restene
r = (x 1 -
Hvor
Så summen
(x 1 -
Det er en ligning som representerer en begrensning (eller binding) i elementene i vektoren r i restene, siden hvis n-1-komponenter i vektoren r er kjent , bestemmer restriksjonsligningen den ukjente komponenten.
Derfor vektoren r av dimensjon n med begrensningen:
X (x i -
Den har (n - 1) frihetsgrader.
Igjen blir det brukt at beregningen av antall frihetsgrader er:
frihetsgrader: = n (dimensjoner) - 1 (begrensninger) = n-1
eksempler
Variasjon og frihetsgrader
Variansen s 2 er definert som gjennomsnittet av kvadratet av avvikene (eller restene) av prøven av n data:
s 2 = ( r • r ) / (n-1)
hvor r er vektoren til restene r = (x1 -
s 2 = ∑ (x i -
I alle fall skal det bemerkes at når man beregner middelet av kvadratet til restene, er det delt med (n-1) og ikke med n, siden antallet frihetsgrader for vektoren r er som omtalt i forrige seksjon ( n-1).
Hvis for beregningen av variansen ble delt med n i stedet for (n-1), ville resultatet ha en skjevhet som er veldig betydelig for verdier på mindre enn 50.
I litteraturen vises variansformelen også med divisoren n i stedet for (n-1), når det gjelder variansen til en populasjon.
Men settet med den tilfeldige variabelen til restene, representert av vektoren r , selv om den har dimensjon n, har bare (n-1) frihetsgrader. Imidlertid, hvis antall data er stort nok (n> 500), konvergerer begge formlene til samme resultat.
Kalkulatorer og regneark gir begge versjoner av variansen og standardavviket (som er kvadratroten til variansen).
Vår anbefaling, med tanke på analysen som presenteres her, er å alltid velge versjon med (n-1) hver gang variansen eller standardavviket må beregnes, for å unngå partiske resultater.
I Chi-torget distribusjon
Noen sannsynlighetsfordelinger i kontinuerlig tilfeldig variabel avhenger av en parameter som kalles frihetsgrad, dette er tilfellet med Chi-kvadratfordelingen (χ 2 ).
Navnet på denne parameteren kommer nettopp fra frihetsgradene til den underliggende tilfeldige vektoren som denne fordelingen gjelder.
Anta at vi har g-populasjoner, som prøver av størrelse n blir tatt fra:
X 1 = (x1 1 , x1 2 , … ..x1 n )
X2 = (x2 1 , x2 2 , … ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 , … ..xg n )
En befolkning j som har betydd
Den standardiserte eller normaliserte variabelen zj i er definert som:
zj i = (xj i -
Og vektoren Zj er definert slik:
Zj = ( zj 1 , zj 2 , …, zj i , …, zj n ) og følger den standardiserte normalfordelingen N (0,1).
Så variabelen:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2), …., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
følger χ 2 (g) fordelingen kalt chi-square fordelingen med frihetsgrad g.
I hypotestesten (med løst eksempel)
Når du vil teste hypoteser basert på et bestemt sett med tilfeldige data, må du vite antall frihetsgrader g for å kunne bruke Chi-square-testen.

Figur 2. Er det en sammenheng mellom preferansen til iskrem FLAVOR og kundens kjønn? Kilde: F. Zapata.
Som et eksempel vil dataene som samles inn om preferansene til sjokolade- eller jordbæris blant menn og kvinner i en viss iskrembar, analyseres. Frekvensen som menn og kvinner velger jordbær eller sjokolade er oppsummert i figur 2.
Først beregnes tabellen over forventede frekvenser, som er utarbeidet ved å multiplisere summen av rader med summen av kolonner, delt med totale data. Resultatet er vist i følgende figur:

Figur 3. Beregning av forventede frekvenser basert på observerte frekvenser (verdier i blått i figur 2). Kilde: F. Zapata.
Deretter blir Chi-kvadratet beregnet (fra dataene) ved å bruke følgende formel:
χ 2 = ∑ (F o - F e ) 2 / F e
Hvor F o er de observerte frekvenser (figur 2) og F e er de forventede frekvenser (Figur 3). Summasjonen går over alle radene og kolonnene, som i vårt eksempel gir fire termer.
Etter å ha gjort operasjonene får du:
χ 2 = 0,2043.
Nå er det nødvendig å sammenligne med det teoretiske Chi-torget, som avhenger av antall frihetsgrader g.
I vårt tilfelle bestemmes dette tallet som følger:
g = (# rader - 1) (# kolonner - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Det viser seg at antall frihetsgrader g i dette eksemplet er 1.
Hvis du vil sjekke eller avvise nullhypotesen (H0: det er ingen sammenheng mellom SMAK og GENDER) med et nivå på betydning på 1%, beregnes den teoretiske Chi-kvadratverdien med frihetsgrad g = 1.
Verdien søkes som gjør den akkumulerte frekvensen (1 - 0,01) = 0,99, det vil si 99%. Denne verdien (som kan fås fra tabellene) er 6.636.
Ettersom den teoretiske Chi overskrider den beregnede, blir nullhypotesen bekreftet.
Med andre ord, med dataene samlet, er det ikke observert noen sammenheng mellom variablene TASTE og GENDER.
referanser
- Minitab. Hva er frihetsgrader? Gjenopprettet fra: support.minitab.com.
- Moore, David. (2009) Grunnleggende anvendt statistikk. Antoni Bosch redaktør.
- Leigh, Jennifer. Hvordan beregne frihetsgrader i statistiske modeller. Gjenopprettet fra: geniolandia.com
- Wikipedia. Frihetsgrad (statistikk). Gjenopprettet fra: es.wikipedia.com
- Wikipedia. Frihetsgrad (fysisk). Gjenopprettet fra: es.wikipedia.com
