- Frekvensfordeling
- Hvor mange klasser bør du vurdere?
- Hvordan oppnås det?
- Eksempel
- Hva er den til?
- Eksempel
- referanser
Den klassemerke , også kjent som midtpunktet, er verdien i sentrum av en klasse, som representerer alle de verdier som er i denne kategorien. I utgangspunktet brukes klassemerket til å beregne visse parametere, for eksempel det aritmetiske gjennomsnittet eller standardavviket.
Så klassemerket er midtpunktet i ethvert intervall. Denne verdien er også veldig nyttig for å finne variansen til et sett med data som allerede er gruppert i klasser, som igjen lar oss forstå hvor langt fra sentrum disse spesifikke dataene ligger.

Frekvensfordeling
For å forstå hva et klassemerke er, er begrepet frekvensfordeling nødvendig. Gitt et sett med data, er en frekvensfordeling en tabell som deler dataene inn i et antall kategorier kalt klasser.
Denne tabellen viser antall elementer som hører til hver klasse; sistnevnte er kjent som frekvens.
Denne tabellen ofrer en del av informasjonen som vi får fra dataene, siden vi i stedet for å ha den individuelle verdien av hvert element, bare vet at den hører til den klassen.
På den annen side får vi en bedre forståelse av datasettet, siden det på denne måten er lettere å sette pris på etablerte mønstre, noe som letter manipulering av nevnte data.
Hvor mange klasser bør du vurdere?
For å utføre en frekvensfordeling, må vi først bestemme antall klasser vi vil ta og velge klassegrensene deres.
Valget av hvor mange klasser man skal ta skal være praktisk, og ta i betraktning at et lite antall klasser kan skjule informasjon om dataene vi ønsker å studere, og en veldig stor kan generere for mange detaljer som ikke nødvendigvis er nyttige.
Faktorene som vi må ta hensyn til når vi velger hvor mange klasser vi skal ta er flere, men blant disse to skiller seg ut: den første er å ta hensyn til hvor mye data vi må vurdere; det andre er å vite hvor stort distribusjonsområdet er (det vil si forskjellen mellom den største og minste observasjonen).
Etter å ha definert klassene fortsetter vi å telle hvor mye data som finnes i hver klasse. Dette tallet kalles frekvensen av klasser og er betegnet med fi.
Som vi tidligere hadde sagt, har vi at en frekvensfordeling mister informasjonen som kommer individuelt fra hver data eller observasjon. Av denne grunn søkes det om en verdi som representerer hele klassen den tilhører; denne verdien er klassemerket.
Hvordan oppnås det?
Klassemerket er kjerneverdien som en klasse representerer. Det oppnås ved å legge grensene for intervallet og dele denne verdien med to. Vi kan uttrykke dette matematisk som følger:
x i = (Nedre grense + Øvre grense) / 2.
I dette uttrykket betegner x i merket av ith-klassen.
Eksempel
Gitt følgende datasett, gi en representativ frekvensfordeling og få tilsvarende klassemerke.

Siden dataene med den høyeste numeriske verdien er 391 og den laveste er 221, har vi at området er 391 -221 = 170.
Vi vil velge 5 klasser, alle med samme størrelse. En måte å velge klasser på er som følger:

Merk at hver data er i en klasse, disse er usammenhengende og har samme verdi. En annen måte å velge klasser er ved å betrakte dataene som en del av en kontinuerlig variabel, som kan nå en hvilken som helst reell verdi. I dette tilfellet kan vi vurdere klasser av skjemaet:
205-245, 245-285, 285-325, 325-365, 365-405
Imidlertid kan denne måten å gruppere data gi noen uklarheter med grensene. For eksempel, i tilfellet 245, oppstår spørsmålet: hvilken klasse hører den til, den første eller den andre?
For å unngå denne forvirringen blir det gjort et sluttpunktskonvensjon. På denne måten vil den første klassen være intervallet (205.245], den andre (245.285], og så videre.

Når klassene er definert, fortsetter vi med å beregne frekvensen, og vi har følgende tabell:

Etter å ha fått frekvensfordelingen av dataene, fortsetter vi med å finne klassemerker for hvert intervall. Vi må faktisk:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
Vi kan representere dette ved følgende graf:

Hva er den til?
Som nevnt tidligere er klassemerket veldig funksjonelt for å finne det aritmetiske gjennomsnittet og variansen til en gruppe data som allerede er gruppert i forskjellige klasser.
Vi kan definere det aritmetiske gjennomsnittet som summen av observasjonene oppnådd mellom prøvestørrelsen. Fra et fysisk synspunkt er dens tolkning som likevektspunktet i et datasett.
Det kan være risikabelt å identifisere et helt datasett med et enkelt nummer, så det må også tas hensyn til forskjellen mellom dette gjennombruddspunktet og de faktiske dataene. Disse verdiene er kjent som avvik fra det aritmetiske gjennomsnittet, og med disse prøver vi å bestemme hvor mye det aritmetiske gjennomsnittet av dataene varierer.
Den vanligste måten å finne denne verdien på er avvik, som er gjennomsnittet av kvadratene til avvikene fra det aritmetiske middelverdi.
For å beregne det aritmetiske gjennomsnittet og variansen til et sett med data gruppert i en klasse, bruker vi henholdsvis følgende formler:

I disse uttrykkene x i er den i-te klassemerke, f jeg representerer den tilsvarende frekvens og k antallet klasser i hvilken de data som ble gruppert.
Eksempel
Ved å benytte oss av dataene gitt i forrige eksempel, har vi at vi kan utvide litt mer dataene i frekvensfordelingstabellen. Du får følgende:

Ved å erstatte dataene i formelen, sitter vi igjen med det aritmetiske middelet som:

Dets varians og standardavvik er:

Av dette kan vi konkludere med at de originale dataene har et aritmetisk gjennomsnitt på 306,6 og et standardavvik på 39,56.
referanser
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beskrivende statistikk. Esic Redaksjon.
- Jhonson Richard A. Miller og Freund Probability and Statesmen for Engineers. Pearson Education.
- Miller I & Freund J. Sannsynlighet og statsmenn for ingeniører. REVERT.
- Sarabia A. Jose Maria, Pascual Marta. Grunnleggende statistikkurs for selskaper
- Llinás S. Humberto, Rojas A. Carlos Beskrivende statistikk og sannsynlighetsfordeling, Universidad del Norte Redaksjon
