- Hvor kommer den empiriske regelen fra?
- Tsjebysjevs teorem
- Normal distribusjon
- Hvordan anvender den empiriske regelen?
- 1- Konstruer intervallene til regelen
- 2- Beregn antall elever i hvert intervall i henhold til prosentene
- 3 - Aldersintervaller er assosiert med antall elever og tolker
- Hva er tommelfingerregelen for?
- Løste øvelser
- Kaniner i reservatet
- Gjennomsnittsvekt av barn i et land
- referanser
En tommelfingerregel er resultatet av praktisk erfaring og observasjon fra det virkelige liv. For eksempel er det mulig å vite hvilke fuglearter som kan observeres på visse steder hver gang på året, og fra den observasjonen kan det etableres en "regel" som beskriver livssyklusene til disse fuglene.
I statistikk refererer den empiriske regelen til gruppering av observasjoner rundt en sentral verdi, gjennomsnittet eller gjennomsnittet, i enheter med standardavvik.
Anta at vi har en gruppe mennesker med en gjennomsnittlig høyde på 1,62 meter og et standardavvik på 0,25 meter, da vil den empiriske regelen tillate oss å definere, for eksempel, hvor mange mennesker vil være i et intervall av det gjennomsnittlige pluss eller minus ett standardavvik?
I følge regelen er 68% av dataene mer eller mindre ett standardavvik fra gjennomsnittet, det vil si at 68% av personene i gruppen vil ha en høyde mellom 1,37 (1,62-0,25) og 1,87 (1,62 + 0,25) ) meter.
Hvor kommer den empiriske regelen fra?
Den empiriske regelen er en generalisering av Tsjebysjev-teoremet og den normale distribusjonen.
Tsjebysjevs teorem
Tchebysjevs teorem sier at: for en verdi av k> 1, er sannsynligheten for at en tilfeldig variabel ligger mellom middel minus k ganger standardavviket, og gjennomsnittet pluss k ganger, er standardavviket større enn eller lik ( 1 - 1 / k 2 ).
Fordelen med dette teoremet er at det brukes på diskrete eller kontinuerlige tilfeldige variabler med noen sannsynlighetsfordeling, men regelen som er definert fra det er ikke alltid veldig presis, ettersom det avhenger av symmetrien til fordelingen. Jo mer asymmetrisk fordelingen av den tilfeldige variabelen er, jo mindre justert til regelen vil være dens oppførsel.
Den empiriske regelen definert fra dette teoremet er:
Hvis k = √2, sies 50% av dataene å være i intervallet:
Hvis k = 2, sies 75% av dataene å være i intervallet:
Hvis k = 3, sies 89% av dataene å være i intervallet:
Normal distribusjon
Normaldistribusjonen, eller Gaussisk bjelle, gjør det mulig å etablere empirisk regel eller regel 68 - 95 - 99,7.
Regelen er basert på sannsynlighetene for forekomst av en tilfeldig variabel i intervaller mellom gjennomsnittet minus ett, to eller tre standardavvik og gjennomsnittet pluss ett, to eller tre standardavvik.
Den empiriske regelen definerer følgende intervaller:
68,27% av dataene er i intervallet:
95,45% av dataene er i intervallet:
99,73% av dataene er i intervallet:
I figuren kan du se hvordan disse intervallene blir presentert og forholdet mellom dem når du øker bredden på grafen.
Empirisk regel. Melikamp Standardiseringen av den tilfeldige variabelen, det vil si uttrykket av den tilfeldige variabelen når det gjelder z eller standard normalvariabel, forenkler bruken av den empiriske regelen, siden variabelen z har et middel som er lik null og et standardavvik lik en .
Derfor definerer anvendelsen av den empiriske regelen i skala av en standard normalvariabel, z, følgende intervaller:
68,27% av dataene er i intervallet:
95,45% av dataene er i intervallet:
99,73% av dataene er i intervallet:
Hvordan anvender den empiriske regelen?
Den empiriske regelen tillater forkortede beregninger når du arbeider med en normalfordeling.
Anta at en gruppe på 100 studenter har en gjennomsnittsalder på 23 år, med et standardavvik på 2 år. Hvilken informasjon tillater den empiriske regelen å få?
Å anvende den empiriske regelen innebærer å følge trinnene:
1- Konstruer intervallene til regelen
Siden gjennomsnittet er 23 og standardavviket er 2, er intervallene:
= =
= =
= =
2- Beregn antall elever i hvert intervall i henhold til prosentene
(100) * 68,27% = 68 studenter omtrent
(100) * 95,45% = 95 studenter omtrent
(100) * 99,73% = 100 studenter omtrent
3 - Aldersintervaller er assosiert med antall elever og tolker
Minst 68 elever er mellom 21 og 25 år.
Minst 95 studenter er mellom 19 og 27 år.
Nesten 100 studenter er mellom 17 og 29 år gamle.
Hva er tommelfingerregelen for?
Den empiriske regelen er en rask og praktisk måte å analysere statistiske data på, og blir mer og mer pålitelig når distribusjonen nærmer seg symmetri.
Nyttigheten avhenger av feltet det brukes i og spørsmålene som blir presentert. Det er veldig nyttig å vite at forekomsten av verdier av tre standardavvik under eller over gjennomsnittet er nesten usannsynlig, selv for ikke-normale fordelingsvariabler er minst 88,8% av tilfellene i de tre sigma-intervallene.
I samfunnsvitenskapene er et generelt konkluderende resultat rekkevidden av gjennomsnittet pluss eller minus to sigma (95%), mens en ny effekt i partikkelfysikk krever at en fem sigma-intervall (99.99994%) betraktes som et funn.
Løste øvelser
Kaniner i reservatet
I et naturreservat anslås det at det i gjennomsnitt er 16 000 kaniner med et standardavvik på 500 kaniner. Hvis fordelingen av variabelen 'antall kaniner i reservatet' er ukjent, er det da mulig å estimere sannsynligheten for at bestanden av kaniner er mellom 15 000 og 17 000 kaniner?
Intervallet kan presenteres i disse begrepene:
15000 = 16000 - 1000 = 16000 - 2 (500) = µ - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s
Derfor: =
Bruker Tchebyshevs teorem, har vi en sannsynlighet på minst 0,75 for at kaninbestanden i naturreservatet er mellom 15 000 og 17 000 kaniner.
Gjennomsnittsvekt av barn i et land
Gjennomsnittsvekten til ett år gamle barn i et land fordeles normalt med et gjennomsnitt på 10 kilo og et standardavvik på omtrent 1 kilo.
a) Beregn prosentandelen ett år gamle barn i landet som har en gjennomsnittsvekt mellom 8 og 12 kilo.
8 = 10 - 2 = 10 - 2 (1) = µ - 2 s
12 = 10 + 2 = 10 + 2 (1) = µ + 2 s
Derfor: =
I følge den empiriske regelen kan det anføres at 68,27% av ett år gamle barn i landet har mellom 8 og 12 kilo vekt.
b) Hva er sannsynligheten for å finne et ett år gammelt barn som veier 7 kilo eller mindre?
7 = 10 - 3 = 10 - 3 (1) = µ - 3 s
Det er kjent at 7 kg vekt representerer verdien µ - 3s, så vel som det er kjent at 99,73% av barna har mellom 7 og 13 kg vekt. Det overlater bare 0,27% av de totale barna for ekstremene. Halvparten av dem, 0,135%, er 7 kilo eller mindre, og den andre halvparten, 0,135%, er 11 kilo eller mer.
Så det kan konkluderes med at det er en sannsynlighet på 0,00135 for at et barn veier 7 kg eller mindre.
c) Hvis landets befolkning når 50 millioner innbyggere og 1 år gamle barn representerer 1% av landets befolkning, hvor mange år gamle barn vil veie mellom 9 og 11 kilo?
9 = 10 - 1 = µ - s
11 = 10 + 1 = µ + s
Derfor: =
I følge den empiriske regelen er 68,27% av ettåringene i landet i intervallet
Det er 500 000 ettåringer i landet (1% av 50 millioner), så 341,350 barn (68,27% av 500 000) veier mellom 9 og 11 kilo.
referanser
- Abraira, V. (2002). Standardavvik og standardfeil. Semergen Magazine. Gjenopprettet fra web.archive.org.
- Freund, R .; Wilson, W .; Mohr, D. (2010). Statistiske metoder. Tredje utg. Academic Press-Elsevier Inc.
- Alicante-server (2017). Empirisk regel (statistiske termer). Gjenopprettet fra glosarios.servidor-alicante.com.
- Lind, D .; Marchal, W .; Wathen, S. (2012). Statistikk anvendt for næringsliv og økonomi. Femtende utg. McGraw-Hill / Interamericana de México SA
- Salinas, H. (2010). Statistikk og sannsynligheter. Gjenopprettet fra uda.cl.
- Sokal, R .; Rohlf, F. (2009). Introduksjon til biostatistikk. Andre utg. Dover-publikasjoner, Inc.
- Spiegel, M. (1976). Sannsynlighet og statistikk. Schaum-serien. McGraw-Hill / Interamericana de México SA
- Spiegel, M .; Stephens, L. (2008). Statistikk. Fjerde utgave McGraw-Hill / Interamericana de México SA
- Stat119 gjennomgang (2019). Å løse empiriske regel spørsmål. Gjenopprettet fra stat119review.com.
- (2019). 68-95-99.7 regel. Gjenopprettet fra en.wikipedia.org.