Grupperede observationer

I denne lektion skal vi beskæftige os med grupperede observationssæt. Det vil sige at vi inddeler vores datasæt i grupper også kaldt for intervaller. Man inddeler et observationssæt i intervaller af praktiske årsager. Deskriptorerne vi gennemgik under de ikke grupperet observationer, har dog stadig præcis de samme betydninger.

Vi vil her kort introducere et eksempel

Skærmbillede 2013-11-03 kl. 9.27.07 PM

Vi antager her, at tabellen ovenfor angiver antal fiskere i Odense. Hvis vi ikke grupperer fiskerne i aldersintervaller, får vi en tabel med 65 observationer fordi fiskerne er mellem 15 og 80 år gamle.

Vi erstatter observationerne med intervaller

Skærmbillede 2013-11-03 kl. 10.04.14 PM

Læg mærke til her at ordet hyppighed er erstattet med ordet intervalhyppighed. Normen er at det tal, der skiller 2 intervaller regnes altid med til det laveste interval.

Observationssættets størrelse

I eksemplet ovenfor er observationssættets størrelse lig med 2.812. Det er naturligvis fordi at datasættet omfatter 2.812 fiskere.

Typeintervallet

Typeintervallet, er det interval der har den største hyppighed. Ligesom hos ikke grupperede observationer, hvis der er flere intervaller med den samme hyppighed, så har vi flere typeintervaller.

Middelværdi

Man antager normalt at observationerne fordeler sig jævnt i intervallerne, dette resulterer i den behagelige konsekvens at gennemsnitsværdien, i dette tilfælde gennemsnitsalderen, i hver interval er intervallets midtpunkt. Middelværdien også kaldt for gennemsnitsalderen kan beregnes med følgende formel:

\(\bar{x}=\frac{m_1\cdot h_1+m_2\cdot h_2+\ldots+m_m\cdot h_m}{n}\)
\(=\frac{\sum_{i=1}^m m_i\cdot h_i}{n}\)

Her angiver \(m_i\) intervalmidtpunktet og \(h_i\) hyppigheden.

I vores eksempel vil vi få en middelværdi på 40,75 år.

\(\bar{x}=\frac{17,5\cdot23+22,5\cdot49+\ldots+72,5\cdot1}{2.812}=40,75\)

I matematik beregnes intervalmidtpunktet \(h\) ved at lægge intervallets grænser sammen og herefter dividere 2 for at finde midtpunktet. Eksempelvis \(\frac{15+20}{2}=17,5\). I matematik bruger man ofte enten

\(\bar{x}=\mu\)

som et symbol for middelværdi/gennemsnittet.

Ligesom ved ikke grupperede observationer kan vi her også beregne varians og standardafvigelse. Frekvens og kumuleret frekvens bliver her i dette tilfælde kaldt for intervalfrekvens samt kumuleret intervalfrekvens. 

Se en videoeksempel på, hvorledes man præcis beregner middelværdi, intervalfrekvens, varians samt standardafvigelse for grupperede observationer.

 

Opgave                                                                                                                                               Skærmbillede 2013-11-09 kl. 9.55.29 PM

Ovenover ser vi fordelingen af gravide i en række aldersintervaller.

Udregn

  • Intervalhyppigheden
  • Intervalfrekvensen
  • Kumuleret intervalfrekvens
  • Middelværdi
  • Tegn sumkurve og aflæs kvartilsættet

Løsning

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *