Home Ressources en Statistiques
Comment examiner la distribution des variables dépendantes et détecter les données extrêmes? PDF Imprimer Envoyer

La Fonction "Explore". Statistiques descriptives et détection de cas aberrants. 

A quoi sert cette commande?

- A décrire les données et examiner si elles sont distribuées normalement.

- A détecter les cas extrêmes. Pour éliminer les outliers voir la fonction "select case". Pour un aperçu plus détaillés des "outliers" (données extrêmes) voir aussi Détecter et éliminer les données extrêmes.
 



Les commandes:
La fonction "Explore" est accessible via le menu suivant: 

    - Analyse

    - Descriptive Statistics

    - Explore

 - Faites glisser votre variable dépendantes dans "Dependent List" en cliquant dessus et en poussant ensuite sur la flèche vers "dependent list". Appuyez sur OK.

L'output: 

 - J'ai effectué cette analyse sur la variable vd1 du fichier "ex1.por" accessible (pour l'ouvrir, cliquez sur file/open et choisissez les documents "portables"). 

 - La fonction "examine" nous fournit plusieurs informations.

                - Statistiques descriptives

                - Stem-and leaf plot

                - Boxplot

                -Statistiques descriptives

    SPSS nous communique tout d'abord une série de statistiques descriptives que je ne détaillerai pas ici.

 
 

Statistic Std. Error
VD1 Mean 13.9516 .6362
95% Confidence Interval for Mean Lower Bound 12.6794
Upper Bound 15.2238
5% Trimmed Mean 13.9104
Median 14.5000
Variance 25.096
Std. Deviation 5.0096
Minimum 2.00
Maximum 30.00
Range 28.00
Interquartile Range 7.0000
Skewness .189 .304
Kurtosis .777 .599

        Toutefois, le maximum et le minimum sont utile pour détecter des erreurs d'encodage.

         Si la médiane est très différente de la moyenne, il est probable que la distribution ne soit pas du tout normale.

         Ensuite, SPSS nous communique un "stem-and-leaf plot" (graphe en "tiges et feuilles" littéralement"):

	Le "Stem-and Leaf" Plot. 
VD1 Stem-and-Leaf Plot

 Frequency    Stem &  Leaf

     2.00        0 .  24
    12.00        0 .  577888899999
    17.00        1 .  00111222233333444
    24.00        1 .  555556666666777777888899
     6.00        2 .  000123
     1.00 Extremes    (>=30)

 Stem width:     10.00
 Each leaf:       1 case(s)

Comment lire ce graphique? Il faut l'envisager comme une courbe retournée que l'on aurait fait basculer sur la droite.

Chaque ligne correspond à une classe d'observations. Ici les sujets ont été divisisés en 6 catégories. Ceux qui ont obtenu des réponses entre 2 et 4, 4 et 9,10 et14, 15

et 19, 20 et 23, et 30 et +. 

Dans la colonne "Frequency", est mentionnée la fréquence d'observations correspondant à chaque classe.

Dans la colonne "Stem" se trouve les valeurs des dizaines correspondant aux observations situées dans cette classe. Par exemple, toutes les observationssituées dans la première classe sont situées sous 10, donc le "stem" (tige) vaut 0.

Au-dessus de 10, il vaut 1, au-dessus de 20, 2.

Chaque chiffre dans la partie "leaf" correspond à une observation. Il suffit de combiner la valeur du "stem" et ce chiffre pour déterminer la valeur de la VD correspondant à cette observation. Par exemple, pour la première classe, ce

sera 02 et 04, pour la seconde, 05, 07,07, etc. Pour la troisième 10,10,11, etc.

La ligne "extremes" indique les cas "aberrants". Ici, une observation supérieure à 3.

Cette analyse permet également d'examiner si la distribution est relativement normale. On observe visuellement que le nombre de sujets augmente vers un "pic", dans la quatrième classe, pour ensuite redescendre, ce qui est compatible avec une distribution normale.

	
	- Le Box-Plot
	alt		

- La "boîte rouge" indique l'intervalle dans lequel se situent la plupart des données (entre 10 et 17 approximativement). De part et d'autre de cette boîte se trouvent des intervalles plus éloignés qui indiquent où se situent certaines données plus éloignées mais encore acceptables. Les valeurs extrêmes (ici 30) se situent à l'extérieur de cet intervalle. Dans ce cas-ci, il s'agit du sujet n. 1 qui a obtenu une valeur de 30.

Mise à jour le Mardi, 22 Décembre 2009 09:12
 
<< Début < Précédent 1 2 3 4 5 6 7 8 9 10 Suivant > Fin >>

Page 5 sur 21