- Formler og ligninger
- Hvordan beregne samplingsfeil
- For et nivå av selvtillit
- eksempler
- - Eksempel 1
- Løsning
- - Eksempel 2
- Løsning
- - Eksempel 3
- Løsning
- - Eksempel 4
- Løsning
- - Oppgave 5
- Løsning
- referanser
Den sampling feil eller sampling feil i statistikken er forskjellen mellom den midlere verdi av en prøve, og den midlere verdi av den totale populasjonen. For å illustrere ideen, la oss tenke oss at den totale befolkningen i en by er en million mennesker, hvorav du vil ha den gjennomsnittlige skostørrelsen, som det tas en tilfeldig prøve på tusen mennesker.
Gjennomsnittsstørrelsen som kommer ut av prøven vil ikke nødvendigvis sammenfalle med den for den totale befolkningen, selv om verdien av prøven ikke er partisk, må verdien være nær. Denne forskjellen mellom middelverdien av utvalget og den for den totale befolkningen er samplingsfeilen.

Figur 1. Siden utvalget er en delmengde av den totale populasjonen, har utvalgsmidlet en feilmargin. Kilde: F. Zapata.
Gjennomsnittsverdien av den totale populasjonen er generelt ukjent, men det er teknikker for å redusere denne feilen og formler for å estimere samplingsfeilmarginen som vil bli diskutert i denne artikkelen.
Formler og ligninger
La oss si at vi vil vite middelverdien av en viss målbar karakteristikk x i en populasjon av størrelse N, men siden N er et stort antall er det ikke mulig å gjennomføre studien på den totale populasjonen, så fortsetter vi å ta et tilfeldig utvalg av størrelse n <
Middelverdien av prøven er angitt med
Anta at det tas prøver fra den totale populasjonen N, alle av samme størrelse n med middelverdiene
Disse middelverdiene vil ikke være identiske med hverandre, og vil alle være rundt befolkningens middelverdi μ. Samplingsfeilmargin E indikerer den forventede separasjonen av middelverdiene
Standard feilmargin ε for prøven i størrelse n er:
ε = σ / √n
hvor σ er standardavviket (kvadratroten til variansen), som beregnes ved hjelp av følgende formel:
σ = √
Betydningen av standard feilmargin ε er som følger:
Middelverdi
Hvordan beregne samplingsfeil
I forrige avsnitt ble formelen for å finne standard feilmarginen til et utvalg av størrelse n gitt, der ordstandarden indikerer at det er en feilmargin med 68% konfidens.
Dette indikerer at hvis mange prøver av samme størrelse n ble tatt, vil 68% av dem gi middelverdier
Det er en enkel regel, kalt 68-95-99.7-regelen, som lar oss finne prøvetakingsmargin E for konfidensnivåer på 68%, 95% og 99,7%, siden denne marginen er 1 ε, 2 Henholdsvis ⋅ ε og 3⋅ ε.
For et nivå av selvtillit
Hvis konfidensnivået γ ikke er et av de ovennevnte, er samplingsfeilen standardavviket σ multiplisert med faktoren Zγ, som oppnås ved følgende prosedyre:
1.- Først bestemmes signifikansnivået α, som beregnes fra konfidensnivået γ gjennom følgende forhold: α = 1 - γ
2.- Da må vi beregne verdien 1 - α / 2 = (1 + γ) / 2, som tilsvarer den akkumulerte normale frekvensen mellom -∞ og Zγ, i en normal eller Gaussisk fordeling typifisert F (z), hvis definisjon kan sees i figur 2.
3.- Ligningen F (Zγ) = 1 - α / 2 løses ved hjelp av tabellene for den normale (kumulative) fordelingen F, eller ved hjelp av et dataprogram som har den omvendte standardiserte Gauss-funksjonen F -1 .
I sistnevnte tilfelle har vi:
Zγ = G -1 (1 - α / 2).
4.- Til slutt brukes denne formelen for samplingsfeilen med et pålitelighetsnivå γ:
E = Zγ ⋅ (σ / √n)

Figur 2. Tabell over normalfordeling. Kilde: Wikimedia Commons.
eksempler
- Eksempel 1
Beregn standard feilmargin i gjennomsnittsvekten til en prøve på 100 nyfødte. Beregningen av gjennomsnittsvekten var
Løsning
Standard feilmargin er ε = σ / √n = (1500 kg) / √100 = 0,15 kg. Dette betyr at med disse dataene kan det utledes at vekten til 68% av nyfødte er mellom 2 950 kg og 3,25 kg.
- Eksempel 2
Bestem prøvetakingsmargin for feil E og vektområdet for 100 nyfødte med 95% konfidensnivå hvis gjennomsnittsvekten er 3.100 kg med standardavvik σ = 1.500 kg.
Løsning
Hvis regel 68 gjelder; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, vi har:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Med andre ord, 95% av nyfødte vil ha vekter mellom 2.800 kg og 3.400 kg.
- Eksempel 3
Bestem vekten av de nyfødte i eksempel 1 med en sikkerhetsmargin på 99,7%.
Løsning
Prøvetakingsfeilen med 99,7% tillit er 3 σ / √n, som for vårt eksempel er E = 3 * 0,15 kg = 0,45 kg. Herfra følger det at 99,7% av nyfødte vil ha vekter mellom 2.650 kg og 3.550 kg.
- Eksempel 4
Bestem faktoren Zγ for et konfidensnivå på 75%. Bestem marginen for samplingsfeil med dette nivået av pålitelighet for saken presentert i eksempel 1.
Løsning
Konfidensnivået er γ = 75% = 0,75, som er relatert til signifikansnivået α gjennom forholdet γ = (1 - α), slik at signifikansnivået er α = 1 - 0.75 = 0 , 25.
Dette betyr at den kumulative normale sannsynligheten mellom -∞ og Zγ er:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Som tilsvarer en Zγ-verdi på 1.1503, som vist i figur 3.

Figur 3. Bestemmelse av Zγ-faktoren som tilsvarer et konfidensnivå på 75%. Kilde: F. Zapata gjennom Geogebra.
Med andre ord er samplingsfeilen E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Når det brukes på dataene fra eksempel 1, gir det en feil av:
E = 1,15 * 0,15 kg = 0,17 kg
Med et konfidensnivå på 75%.
- Oppgave 5
Hva er konfidensnivået hvis Z α / 2 = 2,4?
Løsning
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Betydningsnivået er:
α = 0,0164 = 1,64%
Og til slutt gjenstår tillitsnivået:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
referanser
- Canavos, G. 1988. Probability and Statistics: Applications and Methods. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. Åttende. Edition. Cengage.
- Levin, R. 1988. Statistikk for administratorer. Andre. Edition. Prentice Hall.
- Sudman, S. 1982. Stille spørsmål: En praktisk guide til design av spørreskjemaer. San Fransisco. Jossey Bass.
- Walpole, R. 2007. Probability and Statistics for Engineering and Sciences. Pearson.
- Wonnacott, TH og RJ Wonnacott. 1990. Innledende statistikk. 5. utg. Wiley
- Wikipedia. Prøvetakingsfeil. Gjenopprettet fra: en.wikipedia.com
- Wikipedia. Feilmargin. Gjenopprettet fra: en.wikipedia.com
