PRØVETAKINGSFEIL: FORMLER OG LIGNINGER, BEREGNING, EKSEMPLER - DUDAS

Den sampling feil eller sampling feil i statistikken er forskjellen mellom den midlere verdi av en prøve, og den midlere verdi av den totale populasjonen. For å illustrere ideen, la oss tenke oss at den totale befolkningen i en by er en million mennesker, hvorav du vil ha den gjennomsnittlige skostørrelsen, som det tas en tilfeldig prøve på tusen mennesker.

Gjennomsnittsstørrelsen som kommer ut av prøven vil ikke nødvendigvis sammenfalle med den for den totale befolkningen, selv om verdien av prøven ikke er partisk, må verdien være nær. Denne forskjellen mellom middelverdien av utvalget og den for den totale befolkningen er samplingsfeilen.

Figur 1. Siden utvalget er en delmengde av den totale populasjonen, har utvalgsmidlet en feilmargin. Kilde: F. Zapata.

Gjennomsnittsverdien av den totale populasjonen er generelt ukjent, men det er teknikker for å redusere denne feilen og formler for å estimere samplingsfeilmarginen som vil bli diskutert i denne artikkelen.

Formler og ligninger

La oss si at vi vil vite middelverdien av en viss målbar karakteristikk x i en populasjon av størrelse N, men siden N er et stort antall er det ikke mulig å gjennomføre studien på den totale populasjonen, så fortsetter vi å ta et tilfeldig utvalg av størrelse n <

Middelverdien av prøven er angitt med og middelverdien av den totale befolkningen er angitt med den greske bokstaven μ (les mu eller miu).

Anta at det tas prøver fra den totale populasjonen N, alle av samme størrelse n med middelverdiene 1>, 2>, 3> ….m>.

Disse middelverdiene vil ikke være identiske med hverandre, og vil alle være rundt befolkningens middelverdi μ. Samplingsfeilmargin E indikerer den forventede separasjonen av middelverdiene i forhold til befolkningens middelverdi μ innenfor en spesifisert prosentandel kalt konfidensnivået γ (gamma).

Standard feilmargin ε for prøven i størrelse n er:

ε = σ / √n

hvor σ er standardavviket (kvadratroten til variansen), som beregnes ved hjelp av følgende formel:

σ = √

Betydningen av standard feilmargin ε er som følger:

Middelverdi oppnådd av prøven med størrelse n er inkludert i intervallet ( - ε, + ε) med et konfidensnivå på 68,3%.

Hvordan beregne samplingsfeil

I forrige avsnitt ble formelen for å finne standard feilmarginen til et utvalg av størrelse n gitt, der ordstandarden indikerer at det er en feilmargin med 68% konfidens.

Dette indikerer at hvis mange prøver av samme størrelse n ble tatt, vil 68% av dem gi middelverdier i området.

Det er en enkel regel, kalt 68-95-99.7-regelen, som lar oss finne prøvetakingsmargin E for konfidensnivåer på 68%, 95% og 99,7%, siden denne marginen er 1 ε, 2 Henholdsvis ⋅ ε og 3⋅ ε.

For et nivå av selvtillit

Hvis konfidensnivået γ ikke er et av de ovennevnte, er samplingsfeilen standardavviket σ multiplisert med faktoren Zγ, som oppnås ved følgende prosedyre:

1.- Først bestemmes signifikansnivået α, som beregnes fra konfidensnivået γ gjennom følgende forhold: α = 1 - γ

2.- Da må vi beregne verdien 1 - α / 2 = (1 + γ) / 2, som tilsvarer den akkumulerte normale frekvensen mellom -∞ og Zγ, i en normal eller Gaussisk fordeling typifisert F (z), hvis definisjon kan sees i figur 2.

3.- Ligningen F (Zγ) = 1 - α / 2 løses ved hjelp av tabellene for den normale (kumulative) fordelingen F, eller ved hjelp av et dataprogram som har den omvendte standardiserte Gauss-funksjonen F ^-1 .

I sistnevnte tilfelle har vi:

Zγ = G ^-1 (1 - α / 2).

4.- Til slutt brukes denne formelen for samplingsfeilen med et pålitelighetsnivå γ:

E = Zγ ⋅ (σ / √n)

Figur 2. Tabell over normalfordeling. Kilde: Wikimedia Commons.

eksempler

- Eksempel 1

Beregn standard feilmargin i gjennomsnittsvekten til en prøve på 100 nyfødte. Beregningen av gjennomsnittsvekten var= 3.100 kg med standardavvik σ = 1.500 kg.

Løsning

Standard feilmargin er ε = σ / √n = (1500 kg) / √100 = 0,15 kg. Dette betyr at med disse dataene kan det utledes at vekten til 68% av nyfødte er mellom 2 950 kg og 3,25 kg.

- Eksempel 2

Bestem prøvetakingsmargin for feil E og vektområdet for 100 nyfødte med 95% konfidensnivå hvis gjennomsnittsvekten er 3.100 kg med standardavvik σ = 1.500 kg.

Løsning

Hvis regel 68 gjelder; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, vi har:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Med andre ord, 95% av nyfødte vil ha vekter mellom 2.800 kg og 3.400 kg.

- Eksempel 3

Bestem vekten av de nyfødte i eksempel 1 med en sikkerhetsmargin på 99,7%.

Løsning

Prøvetakingsfeilen med 99,7% tillit er 3 σ / √n, som for vårt eksempel er E = 3 * 0,15 kg = 0,45 kg. Herfra følger det at 99,7% av nyfødte vil ha vekter mellom 2.650 kg og 3.550 kg.

- Eksempel 4

Bestem faktoren Zγ for et konfidensnivå på 75%. Bestem marginen for samplingsfeil med dette nivået av pålitelighet for saken presentert i eksempel 1.

Løsning

Konfidensnivået er γ = 75% = 0,75, som er relatert til signifikansnivået α gjennom forholdet γ = (1 - α), slik at signifikansnivået er α = 1 - 0.75 = 0 , 25.

Dette betyr at den kumulative normale sannsynligheten mellom -∞ og Zγ er:

P (Z ≤ Zγ) = 1 - 0,125 = 0,875

Som tilsvarer en Zγ-verdi på 1.1503, som vist i figur 3.

Figur 3. Bestemmelse av Zγ-faktoren som tilsvarer et konfidensnivå på 75%. Kilde: F. Zapata gjennom Geogebra.

Med andre ord er samplingsfeilen E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).

Når det brukes på dataene fra eksempel 1, gir det en feil av:

E = 1,15 * 0,15 kg = 0,17 kg

Med et konfidensnivå på 75%.

- Oppgave 5

Hva er konfidensnivået hvis Z _{α / 2} = 2,4?

Løsning

P (Z ≤ Z _{α / 2} ) = 1 - α / 2

P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164

Betydningsnivået er:

α = 0,0164 = 1,64%

Og til slutt gjenstår tillitsnivået:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

referanser

Canavos, G. 1988. Probability and Statistics: Applications and Methods. McGraw Hill.
Devore, J. 2012. Probability and Statistics for Engineering and Science. Åttende. Edition. Cengage.
Levin, R. 1988. Statistikk for administratorer. Andre. Edition. Prentice Hall.
Sudman, S. 1982. Stille spørsmål: En praktisk guide til design av spørreskjemaer. San Fransisco. Jossey Bass.
Walpole, R. 2007. Probability and Statistics for Engineering and Sciences. Pearson.
Wonnacott, TH og RJ Wonnacott. 1990. Innledende statistikk. 5. utg. Wiley
Wikipedia. Prøvetakingsfeil. Gjenopprettet fra: en.wikipedia.com
Wikipedia. Feilmargin. Gjenopprettet fra: en.wikipedia.com

PRØVETAKINGSFEIL: FORMLER OG LIGNINGER, BEREGNING, EKSEMPLER - DUDAS - 2026

Formler og ligninger

Hvordan beregne samplingsfeil

For et nivå av selvtillit

eksempler

- Eksempel 1

Løsning

- Eksempel 2

Løsning

- Eksempel 3

Løsning

- Eksempel 4

Løsning

- Oppgave 5

Løsning

referanser

Redaktørens valg