beaneye.pages.dev

Hvad er central grænse fordeling

Institut for Elektro- og Computerteknologi


Stikprøve: En delmængde af en population betegnes en stikprøve. For at statistiske beregninger kan foretages på stikprøver, skal disse være repræsentative (type):  hvis hundrede tilfældige stikprøver udtages, skal de ligne hinanden. Større stikprøver giver statistiske tests med højere sandsynlighed for repræsentativitet for hele populationen. En klasse af gymnasieelever kan for eksempel betragtes som en repræsentativ stikprøve af danske gymnasieelever.

Middelværdi: Den gennemsnitlige værdi (middeltal) af en variabel (μ) beregnes ved at summere alle værdier og dividere med det samlede antal data (antal værdier). Matematisk formuleret:

Hvor x er den variabel, der undersøges, og N er antallet af observationer.

Median: Medianen angiver den midterste værdi i et datasæt, der er sorteret i numerisk rækkefølge (fra laveste til højeste). Det er den centrale værdi.

Varians: Variansen angiver udsvingene i værdierne for en tilfældig variabel. Den beskriver den gennemsnitlige afvigelse fra middelværdien. Den matematisk beskrivelse:

Hvor xn repræsenterer et individ værdi i variablen, μ er middelværdien, og N er antallet af observationer.  

Standardafvigelse: Standardafvigelsen (σ), også kaldet spredning, er et mål for, hvor meget værdierne i et datasæt afviger fra middelværdien. Stor standardafvigelse indikerer at værdierne gennemsnitligt ligger langt fra middelværdien. Standardafvigelsen er kvadratroden af variansen:

Fordelen ved standardafvigelse frem for varians er, at den har samme enhed som dataene. Dette gør den lettere at fortolke.

Fordeling: En fordeling beskriver, hvordan værdierne i en stikprøve er fordelt omkring middelværdien. Mange tilfældige variabler er normalfordelte. De fleste værdier vil være tæt på middelværdien, og frekvensen falder, når afstanden fra middelværdien stiger. Kurven er symmetrisk omkring middelværdien. Kurvens bredde afhænger af standardafvigelsen. For normalfordelinger repræsenterer ±1σ  de midterste 68,2% af observationer (arealet under kurven), som vist på figur 1. I dette kompendium vil vi se bort fra andre typer af fordelinger. For simplicitets skyld antager vi, at de data vi arbejder med, er normalfordelt.