Excel 2010 : Supprimer les doublons




Pour en finir avec la question des doublons dans les listes de données, je souhaitais simplement rappeler qu'un code VBA ou une macro commande ne vous sera probablement pas utile si vous êtes utilisateurs des versions Excel 2010 ou 2013. Effectivement dans ces versions,  des outils sont intégrés pour la suppression des doublons et devraient largement couvrir la plupart de vos besoins dans ce domaine.

Cette vidéo vous explique la démarche à suivre à travers deux méthodes très simples. Elle vous permettra de plus de découvrir la notion de tableau mise en œuvre par Microsoft pour faciliter le travaux les plus courants sur vos listes de données.




Excel 2010 : Supprimer les doublons dans une... par O_Picot_chez_AV



Bonne consultation...




Le quartet d'Anscombe




Démarrons aujourd'hui une nouvelle série d'articles sur la construction des graphiques dans Excel. La problématique ne sera pas la réalisation technique de ces graphiques (les manipulations nécessaires étant en général d'une extrême simplicité) mais le choix du bon type de représentation en fonction des données à analyser.
Dans ce premier article nous allons étudier le quartet d'Anscombe, il s'agit d'une suite de 4 séries statistique dont les moyennes arithmétiques simples et les variances sont rigoureusement identiques mais dont les tracés sont totalement inégales. Certainement, il s'agit d'un cas fortuit très particulier, mais il met parfaitement en lumière l'importance de l'expression graphique dans l'analyse des données chiffrées.

Étape 1 : Commençons  par la réalisation du tableau chiffrée, après la saisie il suffira de calculer la moyenne =MOYENNE(B5:B15) et la variance =VAR.P.N(B5:B15) et de les recopier vers la droite.


Étape 2 : Traçons maintenant les 4 graphiques (X,Y) à l'aide du type nuage de points, correspondant aux quatre séries de données.



Étape 3 : Nous pouvons maintenant vérifier d'autres propriétés statistiques et constater à nouveau des résultats identiques pour les quatre séries.
En premier lieu vérifions la corrélation des plages X et Y à l'aide des coefficients de corrélation r={COEFFICIENT.CORRELATION(C5:C15;B5:B15)} ou de détermination R2={COEFFICIENT.DETERMINATION(C5:C15;B5:B15)}.



Ensuite calculons les paramètres a et b de l'équation y = ax + b à l'aide de la fonction ={DROITEREG(C5:C15;B5:B15)}, le résultat est immanquablement :

y = 1/2x + 3

Ne reste plus alors que l'ajout à l'aide du menu contextuel de la droite de régression linéaire sur le graphique et la vérification par la méthode graphique d'excel du R2 et de l'équation de la droite. Si vous ne maitrisez pas cette partie, reportez vous à mon article du 1er Mars 2009 sur la tendance d'une série de valeur.


Etape 4 : Essayons maintenant de calculer le r, non pas pour les 11 valeurs de la  série 3, mais uniquement avec 10 valeurs en excluant la valeur aberrante, vous constaterez alors que le coefficient passe de 0.82 à 1. (r = 1 ou r = -1 indiquant une corrélation parfaite)

Conclusion :  Éclairage sur l’intérêt des représentations graphiques et mise en évidence de l'influence des données aberrantes, voici l'apport du quartet d'Anscombe.

Merci de votre attention,



top