Démarrons aujourd'hui une nouvelle série d'articles sur la construction des
graphiques dans
Excel. La problématique ne sera pas la réalisation technique de ces
graphiques (les manipulations nécessaires étant en général d'une extrême simplicité) mais le choix du bon type de représentation en fonction des données à analyser.
Dans ce premier article nous allons étudier le
quartet d'Anscombe, il s'agit d'une suite de 4 séries statistique dont les
moyennes arithmétiques simples et les
variances sont rigoureusement identiques mais dont les tracés sont totalement inégales. Certainement, il s'agit d'un cas fortuit très particulier, mais il met parfaitement en lumière l'importance de l'expression
graphique dans l'analyse des données chiffrées.
Étape 1 : Commençons par la réalisation du tableau chiffrée, après la saisie il suffira de calculer la moyenne
=MOYENNE(B5:B15) et la variance
=VAR.P.N(B5:B15) et de les recopier vers la droite.
Étape 2 : Traçons maintenant les 4
graphiques (X,Y) à l'aide du type
nuage de points, correspondant aux quatre séries de données.
Étape 3 : Nous pouvons maintenant vérifier d'autres propriétés statistiques et constater à nouveau des résultats identiques pour les quatre séries.
En premier lieu vérifions la
corrélation des plages X et Y à l'aide des
coefficients de corrélation r=
{COEFFICIENT.CORRELATION(C5:C15;B5:B15)} ou de
détermination R
2=
{COEFFICIENT.DETERMINATION(C5:C15;B5:B15)}.
Ensuite calculons les paramètres a et b de l'équation y = ax + b à l'aide de la fonction
={DROITEREG(C5:C15;B5:B15)}, le résultat est immanquablement :
y = 1/2x + 3

Ne reste plus alors que l'ajout à l'aide du menu contextuel de la droite de
régression linéaire sur le graphique et la vérification par la méthode graphique d'excel du
R2 et de l'équation de la droite. Si vous ne maitrisez pas cette partie, reportez vous à mon article du 1
er Mars 2009 sur
la tendance d'une série de valeur.
Etape 4 : Essayons maintenant de calculer le
r, non pas pour les 11 valeurs de la série 3, mais uniquement avec 10 valeurs en excluant
la valeur aberrante, vous constaterez alors que le coefficient passe de 0.82 à 1.
(r = 1 ou r = -1 indiquant une corrélation parfaite)
Conclusion : Éclairage sur l’intérêt des représentations graphiques et mise en évidence de l'influence des données aberrantes, voici l'apport du quartet d'Anscombe.
Merci de votre attention,