- Størrelsen på prøven
- Tilfelle 1: størrelsen på befolkningen er ukjent
- Tillitsnivåer og de tilhørende Z-verdiene
- Sak 2: befolkningens størrelse er kjent
- eksempler
- Undersøkelser og spørreskjemaer
- QA
- Fordel
- ulemper
- Trening løst
- Løsning
- referanser
Den tilfeldige samplingen er hvordan du velger et statistisk representativt utvalg fra en gitt populasjon. En del av prinsippet om at hvert element i prøven må ha samme sannsynlighet for å bli valgt.
En trekning er et eksempel på tilfeldig prøvetaking, der hvert medlem av deltakerpopulasjonen tildeles et nummer. For å velge tallene som tilsvarer tombola-premiene (prøven) brukes en tilfeldig teknikk, for eksempel å trekke ut en postkasse de tallene som ble skrevet ned på identiske kort.
Figur 1. Ved tilfeldig prøvetaking trekkes prøven fra populasjonen tilfeldig ved bruk av en eller annen teknikk som sikrer at alle elementer har samme sannsynlighet for å bli valgt. Kilde: netquest.com.
Ved tilfeldig prøvetaking er det viktig å velge utvalgsstørrelse på riktig måte, fordi et ikke-representativt utvalg av befolkningen kan føre til feilaktige konklusjoner, på grunn av statistiske svingninger.
Størrelsen på prøven
Det er formler for å bestemme riktig størrelse på en prøve. Den viktigste faktoren å vurdere er om befolkningsstørrelsen er kjent eller ikke. La oss se på formlene for å bestemme prøvestørrelsen:
Tilfelle 1: størrelsen på befolkningen er ukjent
Når populasjonsstørrelsen N er ukjent, er det mulig å velge en prøve med tilstrekkelig størrelse n for å bestemme om en viss hypotese er sann eller usann.
For dette brukes følgende formel:
Hvor:
-p er sannsynligheten for at hypotesen er sann.
-q er sannsynligheten for at det ikke er det, derfor er q = 1 - p.
-E er den relative feilmarginen, for eksempel har en feil på 5% en margin på E = 0,05.
-Z har å gjøre med nivået av selvtillit som studien krever.
I en standardisert (eller normalisert) normalfordeling har et konfidensnivå på 90% Z = 1,645, fordi sannsynligheten for at resultatet er mellom -1,645σ og + 1,645σ er 90%, hvor σ er standardavviket .
Tillitsnivåer og de tilhørende Z-verdiene
1.- 50% konfidensnivå tilsvarer Z = 0,675.
2.- 68,3% konfidensnivå tilsvarer Z = 1.
3.- 90% konfidensnivå tilsvarer Z = 1.645.
4.- 95% konfidensnivå tilsvarer Z = 1,96
5.- 95,5% konfidensnivå tilsvarer Z = 2.
6.- 99,7% konfidensnivå tilsvarer Z = 3.
Et eksempel der denne formelen kan brukes ville være i en studie for å bestemme gjennomsnittsvekten av småstein på en strand.
Det er klart det ikke er mulig å studere og veie alle rullesteinene på stranden, så det er praktisk å trekke ut en prøve så tilfeldig som mulig og med riktig antall elementer.
Figur 2. For å studere egenskapene til rullesteinene på en strand, er det nødvendig å velge en tilfeldig prøve med et representativt antall av dem. (Kilde: pixabay)
Sak 2: befolkningens størrelse er kjent
Når antallet N av elementer som utgjør en viss populasjon (eller univers) er kjent, hvis du vil velge en enkel tilfeldig prøvetaking av et statistisk signifikant utvalg av størrelse n, er dette formelen:
Hvor:
-Z er koeffisienten assosiert med tillitsnivået.
-p er sannsynligheten for suksess for hypotesen.
-q er sannsynligheten for svikt i hypotesen, p + q = 1.
-N er størrelsen på den totale befolkningen.
-E er den relative feilen i studieresultatet.
eksempler
Metodikken for å trekke ut prøvene avhenger mye av hvilken type undersøkelse som må gjøres. Derfor har tilfeldig prøvetaking et uendelig antall applikasjoner:
Undersøkelser og spørreskjemaer
I telefonundersøkelser blir for eksempel personene som skal konsulteres valgt med en tilfeldig tallgenerator, som er relevant for regionen som studeres.
Hvis du vil bruke et spørreskjema til ansatte i et stort selskap, kan du ty til valg av respondenter gjennom deres ansattnummer, eller identitetskortnummer.
Nevnte nummer må også velges tilfeldig, for eksempel ved bruk av en tilfeldig tallgenerator.
Figur 3. Et spørreskjema kan brukes ved å velge deltakerne tilfeldig. Kilde: Pixabay.
QA
I tilfelle at studien er på deler produsert av en maskin, må deler velges tilfeldig, men fra partier produsert til forskjellige tider på dagen, eller på forskjellige dager eller uker.
Fordel
Enkel tilfeldig prøvetaking:
- Det gjør det mulig å redusere kostnadene for en statistisk studie, siden det ikke er nødvendig å studere den totale populasjonen for å oppnå statistisk pålitelige resultater, med ønsket konfidensnivå og feilnivået som kreves i studien.
- Unngå skjevhet: ettersom valget av elementene som skal studeres er helt tilfeldig, gjenspeiler studien trofast populasjonens egenskaper, selv om bare en del av den ble studert.
ulemper
- Metoden er ikke tilstrekkelig i tilfeller hvor du ønsker å vite preferansene i forskjellige grupper eller populasjonslag.
I dette tilfellet er det å foretrekke å bestemme tidligere grupper eller segmenter som studien skal utføres på. Når lagene eller gruppene er definert, så hvis det er praktisk for hver enkelt av dem å bruke tilfeldig prøvetaking.
- Det er høyst usannsynlig at det vil bli innhentet informasjon om minoritetssektorer, hvorav det noen ganger er nødvendig å kjenne deres egenskaper.
For eksempel, hvis det er et spørsmål om kampanje for et dyrt produkt, er det nødvendig å vite preferansene til de rikeste minoritetssektorene.
Trening løst
Vi ønsker å studere befolkningens preferanse for en viss coladrikk, men det er ingen tidligere studier i denne populasjonen, hvor størrelsen er ukjent.
På den annen side må utvalget være representativt med et minimums konfidensnivå på 90%, og konklusjonene må ha en prosentvis feil på 2%.
-Hvordan bestemme størrelsen n på prøven?
-Hva vil være utvalgsstørrelsen hvis feilmarginen blir gjort mer fleksibel til 5%?
Løsning
Siden størrelsen på populasjonen er ukjent, brukes formelen gitt ovenfor for å bestemme prøvestørrelsen:
n = (Z 2 p q) / (E 2 )
Vi antar at det er en lik sannsynlighet for preferanse (p) for vårt merke med brus som for ikke-preferanse (q), så p = q = 0,5.
På den annen side, ettersom resultatet av studien må ha en prosentvis feil mindre enn 2%, da vil den relative feilen E være 0,02.
Til slutt produserer en Z-verdi = 1.645 et konfidensnivå på 90%.
Oppsummert har vi følgende verdier:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Med disse dataene beregnes minsteprøven:
n = (1,645 2 0,5 0,5) / (0,02 2 ) = 1691,3
Dette betyr at studien med den nødvendige feilmarginen og med valgt nivå av selvtillit, må ha et utvalg av respondenter på minst 1692 individer, valgt ved enkel tilfeldig prøvetaking.
Hvis du går fra en feilmargin på 2% til 5%, er den nye prøvestørrelsen:
n = (1,645 2 0,5 0,5) / (0,05 2 ) = 271
Noe som er et betydelig lavere antall individer. Avslutningsvis er prøvestørrelsen veldig følsom for ønsket feilmargin i studien.
referanser
- Berenson, M. 1985. Statistikk for ledelse og økonomi, konsepter og applikasjoner. Redaksjonell Interamericana.
- Statistikk. Tilfeldig prøvetaking. Hentet fra: encyclopediaeconomica.com.
- Statistikk. Prøvetaking. Gjenopprettet fra: Estadistica.mat.uson.mx.
- Explorable. Tilfeldig prøvetaking. Gjenopprettet fra: explorable.com.
- Moore, D. 2005. Applied Basic Statistics. Andre. Edition.
- Netquest. Tilfeldig prøvetaking. Gjenopprettet fra: netquest.com.
- Wikipedia. Statistisk prøvetaking. Gjenopprettet fra: en.wikipedia.org