Data visualization : choisir le bon graphique à coup sûr

Dans un précédent article, nous avons discuté de la pertinence de présenter nos données sous forme de tableau ou de graphique. Chaque méthode présentant avantages et inconvénients, les graphiques sont particulièrement adaptés pour une vision d'ensemble rapide.
A présent, allons plus loin avec les graphiques et déterminons lesquels sont les plus pertinents. Dans cet article, nous parlerons donc de visualisation de données. Ou data visualization en anglais puisque les anglo-saxons sont plus en pointe dans le domaine.

Il s'agit d'un vrai sujet d'études, qui compte, lui aussi, ses spécialistes. Nous allons donc nous appuyer sur les travaux et études menés par des auteurs comme Stephen Few, William S. Cleveland ou encore Edward Tufte.


 

Quels sont les types de graphiques à éviter ?

Comme nous l'avons déjà observé, les graphiques sont parfaits pour synthétiser et illustrer une situation sans rentrer dans les détails. Pour autant, cela ne veut pas dire que n'importe quel graphique fera l'affaire.

En 1985, William S. Cleveland et Robert McGill ont publié une étude intitulée Graphical Perception and Graphical Methods for Analyzing Scientific Data, dans laquelle ils ont étudié différentes formes de représentations graphiques. Après avoir identifié 7 types de représentations puis mesuré l'efficacité de chacune d'elles, ils ont obtenu le classement suivant :

Efficacite representations graphiques Cleveland McGill data visualization

Plus une représentation est efficace, plus il est facile pour le lecteur d'identifier clairement les informations et les données sous cette forme. En réalité, cela traduit la capacité de l'œil à mesurer ces différentes représentations.

Avec le schéma ci-dessus, nous savons désormais quels sont les graphiques à éviter. Regardons dans Excel ce que nous avons à notre disposition.

Comme le fait Stephen Few dans son ouvrage Show Me the Numbers: Designing Tables and Graphs to Enlighten, vérifions ensemble avec quelques exemples pour nous en convaincre.

 

Mesurer une surface, un exercice compliqué

Voici 2 points de différentes tailles, s'il est facile de voir que le point B est plus gros, il est nettement plus dur d'estimer l'écart de taille.

Comparatif aire surface

En réalité, le point B est 4 fois plus grand que le A. Vous aviez trouvé ? Bravo !

Certes, nous avons insisté là-dessus, le graphique n'a pas pour vocation de communiquer une valeur exacte. Mais un ordre de grandeur reste le minimum. Et même celui-ci est compliqué à estimer quand on mesure des surfaces.

Les graphiques de type Radar ont le même inconvénient. Si le positionnement des valeurs sur chacun des axes est lisible, l'intérêt de ce type de graphique est aussi de pouvoir visualiser une moyenne sur l'ensemble des critères avec l'ensemble de la surface couverte.
En général, un radar ne reste lisible qu'avec peu de catégories et peu de séries de données. Et dans ce cas, un tableau de chiffres est tout aussi lisible et permet de connaître instantanément un niveau moyen.

Comparatif lisibilite tableau graphique radar
 

Réserver le camembert pour le fromage

Lire un camembert peut se faire de deux façons : via l'air de chaque 'part' ou via l'angle au centre du cercle. Nous venons de voir à quel point il est difficile d'estimer des surfaces.
Et nos yeux ne font guère mieux avec des mesuress d'angles, voyons deux cas :

Ci-dessous un camembert partagé en 7 parts : très difficile d'en tirer quoi que ce soit.
Dès que l'on a plus de 4 à 5 secteurs, la répartition devient quasi impossible à identifier.

Camembert sept parts

Ci-dessous un camembert avec seulement 3 valeurs.
Cette fois, le nombre de secteurs est limité mais les valeurs sont trop proches pour pouvoir les classer.

Comparatif lisibilite tableau graphique camembert

Bref, ce type de graphique n'est efficace que dans très peu de cas : peu de catégories, des valeurs suffisamment éloignées pour les distinguer.

Et les graphiques en anneaux (ou donuts pour ceux qui sont passés au dessert) ne font que pire puisque la mesure de l'angle est impossible sur ceux-ci.

 

Oublier la 3ème dimension

Ajouter une 3ème dimension n'apporte que de la confusion. Les volumes sont difficiles à lire.
Sur un histogramme, instinctivement on va aller chercher la valeur maximale de la face avant de chaque pavé. Du coup, autant la mesurer sur un histogramme plat en 2D.

Sur un camembert, c'est encore pire. Nous venons de voir qu'ils sont déjà difficiles à lire en 2D. L'inclinaison fausse même la lecture, elle amplifie les valeurs qui se trouvent au premier plan.

Dans le graphique ci-dessous, le secteur B donne l'impression d'être le plus grand. L'angle au centre du camembert et la surface représentée sont accentués par cette inclinaison en 3D. Pourtant, les valeurs n'ont pas changé par rapport à l'exemple précédent, le secteur B est celui qui a la valeur la plus faible...

Camembert trois parts 3D
 

Utiliser les couleurs avec précaution

Les couleurs ne représentent pas un type de graphique en particulier. Toutefois, nous pouvons les utiliser pour rendre nos visuels moins ternes mais les couleurs en elles-mêmes n'ont pas de signification pour le lecteur.

Il existe quelques cas dans lesquels la couleur peut avoir un sens par convention : un écart positif en vert, négatif en rouge par exemple. Mais ces cas sont finalement rares. Nous y revenons dans un 2ème article consacré aux erreurs à ne pas faire, y compris avec le bon type de graphique.

Pour l'heure, commençons par identifier ces 'bons' types de graphiques.

 

Pour une lecture facile : positionnement et longueur

Il y a deux types de représentations que nous n'avons pas encore vues : le positionnement et la longueur.
Les spécialistes s'accordent à dire que ce sont les deux meilleures représentations, celles qui sont le plus parlantes et qui vont demander le moins d'efforts pour les lecteurs.

Et elles offrent de nombreuses possibilités : nuages de points, courbes, histogrammes, diagrammes en barres horizontales.
Avec ces types de graphiques, nous pouvons couvrir l'ensemble des besoins en termes de visualisation. Voyons alors comment faire le bon choix selon le contexte.

 

Choisir le graphique adapté à chaque situation

Dans tout graphique, nous montrons une valeur en relation avec une autre. Avant de déterminer le type de graphique, il faut comprendre cette relation. Comment les données à afficher sont-elles liées ?
Pour cette partie, intéressons-nous aux travaux de Stephen Few qui classifie les relations entre données en 7 catégories. Détaillons-les ci-dessous.

 

Temporelle

Représenter des valeurs en fonction du temps (années, mois, semaines, ...) est très courant. 75% des graphiques seraient de ce type.
Pour ce type de relation, deux catégories de graphiques sont bien particulièrement adaptées :

  • Les courbes : via leur forme et leur orientation, elles mettent en évidence la tendance
  • Les histogrammes : les barres permettent une comparaison plus aisée des valeurs entre elles

Temps graphique courbe histogramme

Ajouter les points sur la courbe est une autre possibilité pour faciliter la comparaison des valeurs.

 

Classement

Les données sont présentées par catégories et triées en ordre croissant ou décroissant pour mesurer les performances.
Les barres horizontales sont particulièrement appropriées, les catégories sont affichées les unes en-dessous des autres comme si on lisait une liste.

Classement graphique barres
 

Comparaison

Cette relation ressemble à la précédente. Les données sont présentées par catégorie mais sans que les valeurs ne soient classées, parce que les catégories sont attendues dans un certain ordre (produits regroupés par gamme, tri alphabétique).
Un diagramme en barres, horizontales ou verticales, est la meilleure option pour isoler chaque valeur. Ci-dessous, un exemple avec les mêmes données que précédemment mais avec un tri 'géographique'.

Comparaison graphique barres histogramme
 

Répartition

On parle ici de la décomposition d'un ensemble : parts de marché, répartition des coûts par service par exemple).
Classer les données permet de faire la première partie du travail de lecture, l'ordre se lit directement.
Ensuite, même méthode que pour un classement ou une répartition : un diagramme en barres fait l'affaire. C'est quand même plus lisible que le camembert vu précédemment non ?

Repartition graphique histogramme
 

Variation

Il s'agit de comparer les valeurs par rapport à une référence : valeur N-1, budget, objectifs...
Un diagramme en barres verticales est la solution idéale. Avec un axe des abscisses au milieu du graphique, on isole clairement les écarts positifs des négatifs.

Variation graphique histogramme
 

Distribution

Nous parlons là encore de répartition des valeurs en fonction d'une plage de données. Mais elle diffère de la répartition simple dans le sens où la deuxième valeur est une plage continue de données et non des catégories distinctes.
La courbe permet de lier les éléments entre eux et d'afficher une tendance.

Distribution graphique courbe

Pour marquer plus nettement les valeurs, le rajout des points sur la courbe les met en valeur. L'option histogramme est également possible.

Distribution graphique courbe points
 

Corrélation

Dans ce cas, on cherche à représenter le lien entre deux valeurs et l'influence de l'une sur l'autre : lorsque l'une augmente, l'autre aussi ou au contraire diminue.
Pour montrer que deux variables sont liées, rien ne vaut un nuage de points. Une courbe de tendance est aussi utile pour faciliter la lecture.

Correlation graphique nuage points
 

Synthétisons avec... un tableau

Pour récapituler ces informations, rien de mieux qu'un tableau. Ci-dessous, la synthèse de la partie précédente.

Tableau synthese representations graphiques Stephen Few
 

Nous connaissons désormais les graphiques les plus pertinents et qui facilitent la lecture de nos reportings. Les courbes, nuages de points et barres sont nos meilleurs alliés, quelle que soit la situation.
Pour autant, il est encore possible de se tromper, même avec ces graphiques. Pour être sûr d'éviter les erreurs de couleurs, d'échelles..., lisez les conseils qui figurent dans le prochain article.

N'hésitez pas à laisser vos commentaires sur cet article et à partager votre expérience en matière de dataviz.

 

Abonnez-vous à la newsletter

Illustration couverture ebook 100 trucs et astuces pour Excel-ler au travail

Et recevez gratuitement l'ebook 100 trucs et astuces pour Excel-ler au travail (5€ sur Amazon)

Votre adresse mail ne sera pas communiquée et vous pourrez vous désabonner à tout moment.

Taggé , .Mettre en favori le Permaliens.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.