Hvad er normalfordeling?
Normalfordelingen, også kendt som den gaussiske fordeling, er en sandsynlighedsfordeling, der er symmetrisk omkring middelværdien, hvilket viser, at data nær middelværdien forekommer hyppigere end data langt fra middelværdien. I grafisk form vil normalfordelingen fremstå som en klokkekurve.
Nøglepunkter
- En normalfordeling er den korrekte betegnelse for en sandsynlighedsklokkekurve.
- I en normalfordeling er middelværdien nul, og standardafvigelsen er 1. Den har en skævhed på nul og en kurtosis på 3.
- Normalfordelinger er symmetriske, men ikke alle symmetriske fordelinger er normale.
- I virkeligheden er de fleste prisfordelinger ikke helt normale.
Normalfordeling
Forståelse af normalfordelingen
Normalfordelingen er den mest almindelige fordelingstype, der antages i teknisk analyse af aktiemarkedet og i andre typer af statistiske analyser. Standardnormalfordelingen har to parametre: middelværdien og standardafvigelsen. For en normalfordeling ligger 68 % af observationerne inden for +/- én standardafvigelse fra middelværdien, 95 % ligger inden for +/- to standardafvigelser, og 99,7 % ligger inden for +- tre standardafvigelser.
Normalfordelingsmodellen er motiveret af det centrale grænseteorem. Denne teori fastslår, at gennemsnit beregnet ud fra uafhængige, identisk fordelte tilfældige variabler har tilnærmelsesvis normalfordelinger, uanset hvilken type fordeling variablerne er udtaget fra (forudsat at den har finite varians). Normalfordelingen forveksles undertiden med den symmetriske fordeling. Symmetrisk fordeling er en fordeling, hvor en skillelinje giver to spejlbilleder, men de faktiske data kan ud over den klokkekurve, der indikerer en normalfordeling, være to buler eller en række bakker.
Skewness og Kurtosis
Data fra det virkelige liv følger sjældent, om nogensinde, en perfekt normalfordeling. Skævheds- og kurtosekoefficienterne måler, hvor meget en given fordeling afviger fra en normalfordeling. Skævheden måler symmetrien i en fordeling. Den normale fordeling er symmetrisk og har en skævhed på nul. Hvis fordelingen af et datasæt har en skævhed mindre end nul, eller negativ skævhed, er venstre hale af fordelingen længere end højre hale; positiv skævhed indebærer, at højre hale af fordelingen er længere end venstre hale.
Kurtosestatistikken måler tykkelsen af haleenderne i en fordeling i forhold til normalfordelingens haleender. Fordelinger med stor kurtosis udviser hale data, der overstiger normalfordelingens haler (f.eks. fem eller flere standardafvigelser fra middelværdien). Fordelinger med lav kurtose viser hale-data, som generelt er mindre ekstreme end normalfordelingens hale-data. Normalfordelingen har en kurtosis på tre, hvilket indikerer, at fordelingen hverken har en tyk eller tynd hale. Hvis en observeret fordeling derfor har en kurtosis på over tre, siges fordelingen at have tunge haler i forhold til normalfordelingen. Hvis fordelingen har en kurtosis på mindre end tre, siges den at have tynde haler sammenlignet med normalfordelingen.
Hvordan normalfordelingen anvendes i finanssektoren
Antagelsen om en normalfordeling anvendes på aktivpriser såvel som på prisaktioner. Handlende kan plotte prispunkter over tid for at passe den seneste prisaktion ind i en normalfordeling. Jo længere prisaktion bevæger sig fra middelværdien, i dette tilfælde, jo større sandsynlighed er der for, at et aktiv er over- eller undervurderet. Handlende kan bruge standardafvigelserne til at foreslå potentielle handler. Denne type handel foregår generelt på meget korte tidsrammer, da større tidsrammer gør det meget sværere at vælge indgangs- og udgangspunkter.
Sådan forsøger mange statistiske teorier at modellere priserne på aktiver ud fra den antagelse, at de følger en normalfordeling. I virkeligheden har prisfordelinger en tendens til at have fede haler og derfor en kurtose på mere end tre. Sådanne aktiver har haft prisbevægelser på mere end tre standardafvigelser ud over gennemsnittet oftere, end det ville være forventet under antagelse af en normalfordeling. Selv om et aktiv har gennemgået en lang periode, hvor det passer til en normalfordeling, er der ingen garanti for, at de tidligere resultater virkelig informerer om de fremtidige udsigter.