În teoria probabilității, distribuția normală este o distribuție foarte comună.
Distribuțiile normale sunt importante în statistică și sunt adesea folosite în industrie, științele naturale și sociale pentru a reprezenta variabile reale aleatoare ale căror distribuții nu sunt cunoscute. Câteva instrumente statistice foarte importante se bazează pe prezumția de normalitate. Din acest motiv, este esențial să validăm prezumția pentru variabile continue, astfel încât să putem alege instrumentele (Six Sigma) potrivite.
Distribuția normală este utilă din cauza teoremei limitei centrale, care spune că, în anumite condiții, suma multor variabile aleatoare va avea o distribuție aproximativ normală.
În statistică, pentru a determina dacă un set de date respectă o distribuție normală sunt folosite testele de normalitate. Mai precis, testele sunt o formă de algere a unui model, și pot fi interpretate în mai multe moduri.
Graficul normal probability este o tehnică grafică pentru identificarea abaterilor de la normalitate. Aceasta include identificarea valorilor aberante, asimetria, aplatizarea, etc. Probability Plot normale sunt făcute din date brute și din parametrii estimați.
Probability Plot compară valorile teoretice cu cele observate pentru a testa dacă distribuția este de tip normal.
Pe axa verticală observăm valorile procentuale pentru o distribuție teoretică normală având aceeași medie și deviație standard ca datele colectate. Datele actuale apar pe axa orizontală (a se vedea graficul alăturat).
Dacă cele două distribuții se potrivesc perfect, punctele de pe grafic vor cădea pe o linie dreaptă cu panta egală cu 1. Pentru a fi o distribuțe normală, p-value > 0.05. Toate datele ar trebui să se situeze între cele două benzi curbate de deasupra și de sub linia de 45 °.
Testul statistic (Anderson-Darling) măsoară cât de bine datele urmează o anumită distribuție. De exemplu, putem folosi testul pentru a determina dacă datele respectă prezumția de normalitate pentru un t-test. Putem folosi MINITAB pentru a face aceasta.
Ipotezele pentru testul Anderson-Darling sunt:
❖ H0: Datele respectă o distribuție normală;
❖ H1: Datele nu respectă o distribuție normală.
Folosim p-value pentru a testa normalitatea. În cazul în care p-value este mai mare decât un coeficient de risc numit „risk alfa” (de obicei, 0,05 sau 0,10), nu se poate respinge ipoteza nulă. In imagine, putem vedea că p-value este 0,1 (> 0,05).
În aceste condiții, putem spune că datele noastre urmează o distribuție normală.