Normalna distribucija
Normalna distribucija ili Gaussova distribucija (Gausova kriva), u teoriji vjerovatnoće, je od najčešćih kontinuiranih raspodela – funkcija koja izražava vjerovatnoću da će se bilo koje posmatranje naći između bilo koje dvije stvarne granice ili realnih brojeva, jer kriva, na obje strane, teži ka nuli. Normalna distribucija je izuzetno važna u statistici i često se koristi u prirodnim i društvenim naukama, a za procjenu slučajnosti proučavanih varijabli, čije distribucije nisu poznate.
Gausova raspodjela je važna familija kontinuiranih raspodjela vjerovatnoće. Članovi ove familije su definirani putem dva parametra, matematičko očekivanje, i varijansa (disperzija) σ2. Normalna normirana distribucija je normalna raspodjela sa očekivanjem jednakim nuli (0), uz varijansu jedan.
Ovaj skup distribucija je definirao Karl Fridrih Gaus, kada je analizirao astronomske podatke i formulirao jednačinu funkcije gustine normalne raspodjele.
Normalna distribucija je izuzetno korisna zbog centralne granične teoreme, u koja polazi od pretpostavke da je, pod blagim uvjetima, u mnogim slučajnim varijablama moguće iz nje samostalno izvući uzorak sa istim smislom distribucije, bez obzira na oblik originalne: fizičke količine koja se očekuje da će biti zbir mnogih nezavisnih procesa (kao što su greške mjerenja) koji često imaju distribuciju u neposrednoj blizini normalne. Osim toga, mnogi rezultati i metode (kao što su propagacije neizvjesnosti i najmanji kvadrati kao parametri podobnosti) mogu biti izvedeni analitički u eksplicitnoj formi, kada su relevantne varijable normalno distribuirane.
Gaussova razdioba se ponekad neformalno naziva i zvonasta kriva. Međutim, mnoge druge distribucije su u obliku zvona (kao što je Cauchy distribucija, studentova t-distribucija i logističke distribucije). Izrazi kao Gaussova funkcija i Gaussova zvonasta krive su također dvosmisleni jer ponekad se odnose na višesmislenost normalne distribucije koji se ne mogu izravno tumačiti u smislu vjerojatnosti.
Normalna distibucija je:
Parametar u ovoj definiciji je srednja vrijednost ili očekivane vrijednosti distribucije (kao i njena medijana i modalna vrijednost). Parametar je njena standardna devijacija, a njena varijansa je pritom . Slučajna varijabla u Gaussovoj distribuciji je is tzv. normalno distribuirana i zove se normalna devijacija (standardna devijacija).
Ako je and , distribucija se zove standardna normalna distribucija ili jedinica normalne distribucije označene kao , a slučajna varijabla ove distribucije je standardno normalno odstupanje.
Normalna distribucija je samo apsolutno kontinuirana raspodjela koja se kumulira izvan dvije prethodne (tj, osim srednje vrijednosti i varijanse) kada mogućnost entropije iznosi su nula.
Normalna distribucije je potklasa eliptične distribucije. Normalne distribucije su simetrične oko njihove srednje vrijednosti, uz nultu vjerovatnoću prelaza iza nule preko cijele realne linije. Kao takva, ona ne može biti pogodan model za varijable koje su same po sebi pozitivne ili snažno iskrivljene, kao što su težina osobe ili cijena u finansijama. Takve varijable mogu bolje opisati druge distribucije, kao što je log-normalnu distribucija ili Pareto distribucija. Vrijednost normalne distribucije je praktično nula kada se vrijednost x nalazi više od nekoliko standardnih devijacija udaljena od srednje. Prema tome, ne može biti odgovarajući model kada se očekuje i značajan dio vanjskih vrijednosti koje leže više mnoge standardnih devijacija udaljeno od srednje – i najmanjih kvadrata i drugih. Optimalni metodi za normalno distribuirane varijable često postaju vrlo nepouzdani kada se primjenjuju na takve podatke. U tim slučajevima, treba pretpostaviti i odgovarajuću robusnost statističkog zaključka primjenljivim metodima.
Gaussova raspodjela pripada porodici stabilnih distribucija čiji su atraktori sume nezavisni, identično distribuirani.
Reference
- Normal Distribution, Gale Encyclopedia of Psychology
- Šablon:Harvtxt
- Havil, 2003
- Lyon A. (2014). Why are Normal Distributions Normal?, The British Journal for the Philosophy of Science.
- Cover, Thomas M.; Thomas, Joy A. (2006). Elements of Information Theory. John Wiley and Sons. str. 254.
- Park, Sung Y.; Bera, Anil K. (2009). “Maximum Entropy Autoregressive Conditional Heteroskedasticity Model”. Journal of Econometrics (Elsevier) 150 (2): 219–230. doi:10.1016/j.jeconom.2008.12.014. Pristupljeno 2011-06-02.