Ajustement d’une distribution à une loi Normale

* Skewness, kurtosis description de la forme;
* regarder si unimodale : si Moyenne=médiane=mode ;
* si |skewness| et |kurtosis| <1 ;
* pour les tests paramétriques de comparaison, un faible rejet de la normalité 
est peu problématque si effectifs des groupes proches ;

********************************************************************************;
Exploration avec une proc means

title2 H=4 J=c "MEANS : Description de la variable intervalle";
proc means data=in
n mean median min max CLM
skewness kurtosis;
var catotal;
run;

Exploration avec une proc tabulate

title2 H=4 J=c "TABULATE : Description de la variable intervalle";
proc tabulate data=in ;
var catotal_0;
class Genre ;
table catotal*(n mean std max min skewness kurtosis);
run;

Test statistiques de normalité

* Shapiro-Wilks W : Hypothèse d’une distribution Normale ;
*********************************************************;
* http://faculty.chass.ncsu.edu/garson/PA765/assumpt.htm ;
Title2 H=4 J=c "Ajustement d’une distribution Normale" ;
* Ho= Normalité acceptée, test standard pour les échantillons inférieur à n= 200
sinon K-S (Kolmogorov-Smirnov);
proc univariate data=in normal;
var catotal ;
histogram catotal / normal ( mu = est sigma = est color = red) ;
probplot catotal  / normal (mu=est sigma=est);
run;
* Jarque-Bera : à partir de la skewness et de la kurtosis ;
**********************************************************;
(voir page Jarque-Bera)

*******************************************************************************;
* Kolmogorov-Smirnov D ou Lilliefors correction : Hypothèse d’une distribution Normale ;
* pour les grands échantillons, rejet H0 très fréquent même pour faible distorsion ;
* utiliser aussi les autres critères : Skewness, kurtosis,… ;
* test de K-S : plus grande différence verticale : écart prévu et réel ;
* Anderson-Darling (A2),Cramer-von Mises W2 : écart au carré entre prévu et réel
* (edf pour Empirical Distribution Function);
*******************************************************************************;
Title2 H=4 J=c "Kolmogorov-Smirnov D (Lilliefors correction : Ajustement d’une distribution" ;
proc univariate data=in normal;
var catotal ;
run;
Publié dans Marketing SAS Tagués avec :