- Formler og ligninger
- Forskjeller med binomialfordelingen
- eksempler
- Praktiske applikasjoner
- Tilnærming til binomialfordelingen med Poisson-distribusjonen
- Løste øvelser
- Oppgave 1
- Løsning c)
- Oppgave 2
- Løsning på)
- referanser
Den Poisson-fordelingen er en diskret sannsynlighetsfordeling, ved hvilken det er mulig å vite sannsynligheten for at, innenfor et stort utvalg størrelse og i løpet av et visst intervall, en hendelse som har sannsynlighet er liten vil oppstå.
Ofte kan Poisson-distribusjonen brukes i stedet for binomialfordelingen, så lenge følgende betingelser er oppfylt: stor prøve og liten sannsynlighet.

Figur 1. Graf over Poisson-distribusjonen for forskjellige parametere. Kilde: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) opprettet denne distribusjonen som bærer navnet hans, veldig nyttig når det gjelder uforutsigbare hendelser. Poisson publiserte sine resultater i 1837, et undersøkelsesverk om sannsynligheten for forekomst av feilaktige straffedomme.
Senere tilpasset andre forskere fordelingen i andre områder, for eksempel antall stjerner som kunne finnes i et visst romvolum, eller sannsynligheten for at en soldat ville dø av sparken fra en hest.
Formler og ligninger
Den matematiske formen for Poisson-distribusjonen er som følger:

- μ (også noen ganger betegnet som λ) er middelet eller parameteren for distribusjonen
- Euler nummer: e = 2.71828
- Sannsynligheten for å oppnå y = k er P
- k er antall suksesser 0, 1,2,3 …
- n er antall tester eller hendelser (utvalgsstørrelse)
Diskrete tilfeldige variabler, som navnet tilsier, avhenger av sjanse og tar bare diskrete verdier: 0, 1, 2, 3, 4 …, k.
Gjennomsnittet av fordelingen er gitt av:

Variansen σ, som måler spredningen av dataene, er en annen viktig parameter. For Poisson-distribusjonen er det:
σ = μ
Poisson bestemte at når n → ∞, og p → 0, har gjennomsnittet μ - også kalt forventet verdi - en konstant:
-Hendelsene eller hendelsene som er vurdert er uavhengige av hverandre og forekommer tilfeldig.
-Sannsynligheten P for en viss hendelse som oppstår i løpet av en bestemt tidsperiode er veldig liten: P → 0.
-Sannsynligheten for at mer enn en hendelse skal skje i tidsintervallet er 0.
-Den gjennomsnittlige verdien tilsvarer en konstant gitt av: μ = np (n er prøvestørrelsen)
- Siden spredningen σ er lik μ, ettersom den vedtar større verdier, blir variasjonen også større.
-Eventene må fordeles jevnt i tidsintervallet som brukes.
-Settet med mulige verdier for hendelsen y er: 0,1,2,3,4….
-Summen av i-variabler som følger en Poisson-distribusjon er også en annen Poisson-variabel. Gjennomsnittsverdien er summen av gjennomsnittsverdiene for disse variablene.
Forskjeller med binomialfordelingen
Poisson-distribusjonen skiller seg fra binomialfordelingen på følgende viktige måter:
-Den binomiale fordelingen påvirkes av både prøvestørrelse n og sannsynligheten P, men Poisson-fordelingen påvirkes bare av gjennomsnittet μ.
-I en binomial fordeling er de mulige verdiene for den tilfeldige variabelen y 0,1,2, …, N, mens det i Poisson-fordelingen ikke er noen øvre grense for disse verdiene.
eksempler
Poisson brukte først sin berømte distribusjon til juridiske saker, men på et industrielt nivå var en av de tidligste bruksområdene med å brygge øl. I denne prosessen brukes gjærkulturer for gjæring.
Gjær består av levende celler, hvor populasjonen varierer over tid. Ved fremstilling av øl er det nødvendig å tilsette den nødvendige mengden, derfor er det nødvendig å vite hvor mye celler det er per volumenhet.
Under andre verdenskrig ble Poisson-distribusjonen brukt for å finne ut om tyskerne faktisk siktet mot London fra Calais, eller bare skyte tilfeldig. Dette var viktig for de allierte for å avgjøre hvor god teknologien som var tilgjengelig for nazistene.
Praktiske applikasjoner
Bruksområdene til Poisson-distribusjonen refererer alltid til teller i tid eller teller i rommet. Og siden sannsynligheten for forekomst er liten, er den også kjent som "loven om sjeldne hendelser."
Her er en liste over hendelser som faller inn i en av disse kategoriene:
-Registrering av partiklene i et radioaktivt forfall, som i likhet med veksten av gjærceller er en eksponentiell funksjon.
-Antall besøk på et bestemt nettsted.
-Utkomst av mennesker til en linje for å betale eller bli deltatt (køteori).
-Antall biler som passerer et bestemt punkt på en vei, i løpet av et gitt tidsintervall.

Figur 2. Antallet biler som passerer gjennom et punkt, følger omtrent en Poisson-distribusjon. Kilde: Pixabay.
-Mutasjoner led i en viss DNA-kjede etter å ha fått eksponering for stråling.
-Tall meteoritter med en diameter større enn 1 m falt i løpet av et år.
-Defekter per kvadratmeter av et stoff.
-Mengden av blodlegemer i 1 kubikk centimeter.
-Ringer per minutt til en telefonsentral.
-Sjokoladebrikker finnes i 1 kg kakedeig.
-Tall trær smittet av en viss parasitt i 1 hektar skog.
Legg merke til at disse tilfeldige variablene representerer antall ganger en hendelse inntreffer i en fast tidsperiode (samtaler per minutt til telefonsentralen), eller et gitt område med plass (stoffdefekter per kvadratmeter).
Disse hendelsene er, som allerede er etablert, uavhengige av tiden som har gått siden forrige forekomst.
Tilnærming til binomialfordelingen med Poisson-distribusjonen
Poisson-distribusjonen er en god tilnærming til binomialfordelingen så lenge:
-Størrelsen på prøven er stor: n ≥ 100
-Sannsynligheten p er liten: p ≤ 0,1
- μ er i størrelsesorden: np ≤ 10
I slike tilfeller er Poisson-distribusjonen et utmerket verktøy, siden binomialfordelingen kan være vanskelig å anvende i disse tilfellene.
Løste øvelser
Oppgave 1
En seismologisk studie slo fast at det i løpet av de siste 100 årene var 93 store jordskjelv rundt om i verden, med minst 6,0 i Richters skala -logaritmisk. Anta at Poisson-distribusjonen er en passende modell i dette tilfellet. Finne:
a) Gjennomsnittlig forekomst av store jordskjelv per år.
b) Hvis P (y) er sannsynligheten for at jordskjelv oppstår i løpet av et tilfeldig valgt år, finn følgende sannsynligheter:


Det er ganske mindre enn P (2).
Resultatene er listet nedenfor:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Vi kan for eksempel si at det er en sannsynlighet på 39,5% for at det ikke vil oppstå noe større jordskjelv i et gitt år. Eller at det er 5,29% av 3 store jordskjelv som skjer i det året.
Løsning c)
c) Frekvensene analyseres og multipliseres med n = 100 år:
39.5; 36,7; 17.1; 5,29; 1,23; 0,229; 0,0355 og 0,00471.
For eksempel:
- En frekvens på 39,5 indikerer at det i 39,5 av 100 år oppstår 0 store jordskjelv, vi kan si at det er ganske nær det faktiske resultatet på 47 år uten noe større jordskjelv.
La oss sammenligne et annet Poisson-resultat med de faktiske resultatene:
- Verdien oppnådd på 36,7 betyr at det i en periode på 37 år er 1 stort jordskjelv. Det faktiske resultatet er at det på 31 år var 1 større jordskjelv, noe som stemmer godt overens med modellen.
- Det forventes 17,1 år med 2 store jordskjelv og det er kjent at det på 13 år, som er en nær verdi, faktisk var 2 store jordskjelv.
Derfor er Poisson-modellen akseptabel for denne saken.
Oppgave 2
Et selskap anslår at antall komponenter som mislykkes før de når 100 driftstimer, følger en Poisson-distribusjon. Hvis gjennomsnittlig antall feil er 8 på den tiden, finn følgende sannsynligheter:
a) At en komponent mislykkes om 25 timer.
b) Feil på mindre enn to komponenter på 50 timer.
c) Minst tre komponenter mislykkes på 125 timer.
Løsning på)
a) Det er kjent at gjennomsnittet av feil på 100 timer er 8, derfor forventes det i løpet av 25 timer en fjerdedel av feil, det vil si 2 feil. Dette vil være μ-parameteren.
Sannsynligheten for at 1 komponent mislykkes blir bedt om, den tilfeldige variabelen er "komponenter som feiler før 25 timer" og dens verdi er y = 1. Ved å erstatte i sannsynlighetsfunksjonen:

Spørsmålet er imidlertid sannsynligheten for at færre enn to komponenter mislykkes på 50 timer, ikke at nøyaktig 2 komponenter mislykkes på 50 timer, derfor må vi legge til sannsynlighetene for at:
-Ikke mislykkes
- Bare feil 1

Parameteren μ for fordelingen i dette tilfellet er:
μ = 8 + 2 = 10 feil på 125 timer.
P (3 eller flere komponenter mislykkes) = 1- P (0) - P (1) - P (2) =

referanser
- MathWorks. Poisson distribusjon. Gjenopprettet fra: es.mathworks.com
- Mendenhall, W. 1981. Statistikk for ledelse og økonomi. Tredje. utgaven. Grupo Redaksjonell Iberoamérica.
- Stat Trek. Lær deg statistikk. Poisson Distribusjon. Gjenopprettet fra: stattrek.com,
- Triola, M. 2012. Elementær statistikk. 11.. Ed. Pearson Education.
- Wikipedia. Poisson distribusjon. Gjenopprettet fra: en.wikipedia.org
