Choisir un graphique

Choisir un graphique ne consiste pas à parcourir un catalogue de formes visuelles pour retenir celle qui “semble convenir”. Le choix d’un graphique est une décision méthodologique. Il suppose de partir non de la solution, mais du problème à traiter.

La bonne question n’est donc pas :

Quel graphique pourriez-vous utiliser ?

La bonne question est plutôt :

Que devez-vous rendre lisible, à partir de quelles données, pour quel lecteur, dans quel but, et sous quelles contraintes ?

C’est seulement après avoir clarifié cette configuration que le choix d’une forme de représentation devient pertinent.

À retenir

Un graphique est une solution de représentation parmi d’autres. Le bon choix dépend du besoin de lecture, de la structure des données, du public, et du contexte de restitution.

Aller directement à l’Outil d’aide au choix du graphique statistique

Commencer par le problème, pas par la forme

Une erreur fréquente consiste à partir immédiatement du graphique. Vous avez des données, vous ouvrez un logiciel, puis vous essayez différentes options jusqu’à obtenir quelque chose de “présentable”.

Cette logique est trompeuse.

Le problème n’est jamais “faire un graphique”. Le problème peut être, selon les cas :

décrire une structure,
comparer des groupes,
montrer une évolution,
rendre visible une distribution,
repérer une relation,
situer un phénomène dans l’espace,
représenter un réseau,
synthétiser un résultat pour un lecteur donné.

Le graphique n’est qu’une solution possible de représentation. Il faut donc d’abord identifier le problème de lecture, puis examiner les solutions concurrentes.

Partir de la structure des données

Le premier critère de choix est la nature des données.

1. Variable qualitative

Lorsqu’il s’agit de catégories ou de modalités distinctes, la question centrale est souvent celle de la comparaison entre effectifs, parts ou profils.

Les formes les plus souvent pertinentes sont :

diagramme en barres,
barres empilées, avec prudence,
tableau, si la précision numérique compte davantage que l’effet visuel.

Ce qu’il faut éviter :

les courbes, si les catégories n’ont pas d’ordre intrinsèque,
les graphiques circulaires (camembert) dès que la comparaison devient difficile,
les empilements trop complexes.

Exemple

Vous souhaitez montrer la répartition des répondants selon leur mode d’achat principal : magasin, site web, application, téléphone.

Le diagramme en barres est généralement plus pertinent qu’un camembert, car il permet de comparer plus clairement les écarts entre catégories.

Diagramme en barres montrant la répartition des répondants par mode d’achat principal (magasin, site web, application, téléphone). — Exemple. Répartition des répondants selon le mode d’achat principal. Le diagramme en barres rend les écarts entre catégories immédiatement comparables.

2. Variable quantitative

Lorsqu’il s’agit de mesures numériques, il faut distinguer plusieurs situations :

comparer des niveaux,
montrer une distribution,
observer une dispersion,
suivre une évolution.

Une variable quantitative ne conduit donc pas automatiquement à un seul type de graphique.

Exemple

Vous disposez des dépenses mensuelles moyennes de cinq segments de clientèle.

Si votre objectif est de comparer les niveaux moyens, un diagramme en barres peut suffire.

Si votre objectif est de montrer comment les dépenses se répartissent à l’intérieur de chaque segment, il faudra plutôt recourir à un histogramme ou à une boîte à moustaches selon la question posée.

Diagramme en barres comparant les dépenses mensuelles moyennes pour cinq segments de clientèle. — Exemple. Dépenses mensuelles moyennes par segment. Les barres servent ici à comparer des niveaux, pas une distribution.

3. Série temporelle

Lorsqu’il faut montrer une évolution dans le temps, la continuité temporelle devient un élément central.

La courbe est souvent pertinente si l’objectif est de faire apparaître une trajectoire, une tendance, une rupture ou une saisonnalité.

Mais elle ne convient pas dans tous les cas. Si les points sont rares, discontinus ou peu comparables, d’autres formes peuvent être plus justes.

Exemple

Vous souhaitez suivre l’évolution mensuelle du nombre de réclamations sur deux ans.

Une courbe chronologique permet de visualiser les hausses, les baisses et les pics saisonniers.

En revanche, si vous comparez seulement trois dates isolées, un autre format peut être plus lisible.

Histogramme représentant la distribution des âges d’un échantillon, avec classes d’âge sur l’axe horizontal et effectifs sur l’axe vertical. — Exemple. Distribution des âges dans un échantillon. L’histogramme montre la concentration, l’étalement et l’éventuelle asymétrie.

4. Distribution

Quand l’objectif est de montrer comment se répartissent les valeurs d’une variable quantitative, il faut choisir une forme qui rende visible :

la concentration,
la dispersion,
l’asymétrie,
les valeurs extrêmes,
éventuellement la comparaison entre plusieurs distributions.

Exemple

Vous voulez représenter la distribution des âges d’un échantillon.

Un histogramme permet de voir si la population est concentrée autour d’un âge moyen ou étalée sur plusieurs classes.

Si vous comparez plusieurs groupes, la boîte à moustaches devient souvent plus utile pour faire apparaître médianes, dispersions et valeurs atypiques.

Boîtes à moustaches comparant la distribution d’une variable quantitative entre plusieurs groupes, avec médianes et valeurs extrêmes. — Exemple. Distributions comparées entre groupes. La boîte à moustaches rend visibles médiane, dispersion et valeurs atypiques.

5. Relation entre variables

Lorsqu’il s’agit d’observer une relation entre deux variables quantitatives, le nuage de points est souvent la forme la plus informative.

Mais il faut rester prudent : voir une relation graphique ne signifie pas démontrer une causalité.

Exemple

Vous observez le lien entre revenu mensuel et dépenses de loisirs.

Un nuage de points permet de voir si les deux variables évoluent globalement dans le même sens, si la relation est diffuse, ou si certains cas s’écartent fortement de l’ensemble.

Courbe temporelle montrant le nombre de réclamations par mois sur deux années, avec variations et pics saisonniers. — Exemple. Évolution mensuelle du nombre de réclamations sur deux ans. La courbe permet de repérer tendance, pics et ruptures.

Nuage de points représentant revenu mensuel (axe x) et dépenses de loisirs (axe y), avec une dispersion indiquant une relation plus ou moins nette. — Exemple. Relation entre revenu mensuel et dépenses de loisirs. Le nuage de points montre la forme et la dispersion de la relation, sans prouver une causalité.

6. Données géographiques

Lorsqu’une dimension spatiale est essentielle à la compréhension du phénomène, la carte peut être pertinente.

Encore faut-il se demander :

ce que l’espace apporte réellement à la lecture,
si les unités géographiques sont comparables,
si la carte éclaire davantage qu’un tableau ou un graphique classique.

Exemple

Vous souhaitez montrer la densité de clients par canton.

Une carte choroplèthe peut être utile si la variation spatiale a un sens analytique.

Si votre but est simplement de classer les cantons du plus fort au plus faible, un diagramme en barres ordonné sera parfois plus lisible.

Diagramme en barres horizontales ordonnées classant des cantons selon une densité de clients, du plus élevé au plus faible. — Exemple. Classement des cantons par densité de clients. Les barres ordonnées sont souvent plus lisibles qu’une carte si l’objectif est la comparaison.

7. Réseaux (SNA)

Lorsque l’objet étudié est un ensemble de relations entre acteurs, la logique change. Il ne s’agit plus seulement de comparer des valeurs, mais de rendre visibles des connexions, des positions, des centralités ou des regroupements.

Exemple

Vous souhaitez visualiser les relations entre membres d’un comité à partir d’échanges d’emails ou de collaborations déclarées.

Un graphe de réseau peut faire apparaître des acteurs centraux, des sous-groupes ou des positions d’intermédiation.

Mais si le réseau est trop dense, la visualisation peut devenir illisible et une matrice ou un tableau de mesures peut être préférable.

Graphe de réseau montrant des acteurs reliés par des liens d’interaction, avec certains nœuds plus centraux et des regroupements visibles. — Exemple. Graphe de réseau d’interactions entre acteurs. La visualisation met en évidence centralités et sous-groupes, tant que la densité reste lisible.

Le bon choix dépend aussi de l’objectif

La nature des données ne suffit pas. Il faut aussi préciser ce que vous cherchez à faire.

1. Décrire

Si l’objectif est descriptif, le graphique doit aider à rendre visible une structure, une hiérarchie ou une répartition sans surcharge interprétative.

Exemple

Présenter la part de marché de cinq enseignes.

Un diagramme en barres ordonné est souvent plus clair qu’une forme plus sophistiquée.

2. Comparer

Si l’objectif est de comparer, la priorité devient la lisibilité des écarts. Le bon graphique est celui qui rend la comparaison simple, honnête et rapide.

Exemple

Comparer la satisfaction moyenne de trois segments de clientèle.

Un diagramme en barres ou un graphique en points sera souvent plus efficace qu’un graphique plus décoratif.

3. Explorer

Si l’objectif est exploratoire, il peut être légitime d’utiliser une forme plus analytique, moins “présentable”, mais plus utile pour repérer une structure ou une anomalie.

Exemple

Explorer la relation entre ancienneté client et fréquence d’achat.

Un nuage de points, éventuellement accompagné d’une droite de tendance, peut être utile dans une phase d’exploration, même si ce ne sera pas forcément le graphique retenu dans un rapport final.

4. Expliquer

Si l’objectif est explicatif, il faut redoubler de prudence. Un graphique peut soutenir une hypothèse, illustrer une relation ou mettre en scène une structure, mais il n’explique pas à lui seul.

Exemple

Montrer que la baisse des ventes suit une hausse des prix ne suffit pas à prouver que l’une cause l’autre.

Le graphique peut documenter une relation temporelle ou comparative, pas établir automatiquement une causalité.

5. Convaincre, enseigner, publier

Ces objectifs relèvent davantage de la restitution. Ils modifient la forme attendue.

Exemple

Un graphique destiné à un cours peut comporter davantage d’annotations et de repères.

Le même contenu, dans un rapport publié, devra souvent être plus sobre et plus resserré.

Le public change le bon choix

Un même contenu n’est pas représenté de la même manière selon le destinataire.

Pour un étudiant, vous pouvez accepter davantage d’explicitation.
Pour un décideur, vous chercherez souvent une lecture plus synthétique.
Pour un lecteur académique, la densité d’information admissible peut être plus élevée.
Pour un public général, la simplicité de lecture devient plus centrale.

Exemple

Une boîte à moustaches est très utile pour un lecteur formé à la statistique.

Pour un public non spécialiste, il faudra parfois l’accompagner d’une explication, ou choisir une forme plus immédiatement lisible si l’objectif le permet.

Le tableau reste parfois la meilleure solution

L’une des erreurs les plus fréquentes est de croire qu’un graphique est toujours préférable à un tableau. Ce n’est pas vrai.

Le tableau est souvent meilleur :

lorsque la précision des valeurs compte davantage que leur forme générale
lorsque le nombre d’éléments à comparer est élevé
lorsque la structure des données est trop dense pour une représentation simple
lorsque l’objectif principal est la consultation fine plutôt que la perception globale

Exemple

Si vous devez comparer précisément les résultats de 26 cantons sur plusieurs indicateurs, un tableau bien structuré peut être plus utile qu’un graphique surchargé. Le bon choix n’oppose

Quelques erreurs fréquentes

Choisir un graphique, c’est aussi savoir ce qu’il faut éviter.

Il faut notamment éviter :

une courbe pour une variable nominale,
des axes tronqués sans justification explicite,
une représentation visuellement séduisante mais difficile à lire,
une forme qui masque les écarts réels,
une distribution représentée par un graphique inadéquat,
des groupes non comparables présentés comme comparables,
une confusion entre relation visuelle et causalité,
un graphique là où un tableau serait plus juste.

Exemple

Un camembert à douze catégories, avec de faibles écarts entre parts, est presque toujours moins lisible qu’un diagramme en barres ordonné.

Une méthode simple pour choisir

Vous pouvez résumer le raisonnement en six questions.

1. Que voulez-vous rendre visible ?

une hiérarchie,
une répartition,
une évolution,
une dispersion,
une relation,
une structure spatiale,
un réseau

2. Quelle est la nature des données ?

qualitative,
quantitative,
temporelle,
spatiale,
relationnelle ?

3. Quel est l’objectif principal ?

décrire,
comparer,
explorer,
expliquer,
enseigner,
convaincre,
publier ?

4. Qui va lire ?

étudiant,
client,
décideur,
lecteur académique,
public général ?

5. Quelles solutions sont en concurrence ?

graphique,
tableau,
texte,
combinaison de plusieurs formes ?

6. Quels sont les risques ?

surinterprétation,
illisibilité,
comparaison abusive,
surcharge,
faux effet visuel ?

Mini-cas

Vous souhaitez montrer l’évolution trimestrielle du chiffre d’affaires de trois segments à un comité de direction.

la structure des données est temporelle,
l’objectif est à la fois descriptif et décisionnel,
le public veut une lecture rapide.

Une courbe simple à trois séries, clairement nommées, sera souvent plus pertinente qu’un tableau dense ou qu’un graphique empilé difficile à lire.

En résumé

Choisir un graphique, ce n’est pas appliquer une recette. C’est arbitrer entre plusieurs solutions de représentation à partir :

d’un problème de lecture,
d’une structure de données,
d’un objectif,
d’un public,
d’un contexte,
et de risques d’interprétation.

Le bon graphique n’est donc pas celui qui “a l’air clair”.

C’est celui qui répond le plus justement à la configuration du problème.

Outil – Aide au choix du graphique statistique

Choisir un graphique ne consiste pas à appliquer une recette.

Cela suppose de tenir compte :

de l’objectif analytique,
de la nature des variables,
de la structure des données,
de la lisibilité attendue
et du degré de prudence requis.

L’outil proposé ici n’aide donc pas seulement à choisir un graphique.

Il aide à arbitrer une forme de restitution statistique défendable :

graphique,
tableau,
restitution dégradée,
ou absence de visualisation utile lorsque le cas l’exige.

À quoi sert cet outil

Cet outil aide à répondre à une question simple en apparence, mais souvent mal posée en pratique :

quelle forme de restitution est la plus défendable ici ?

Il permet de travailler à partir de configurations élémentaires, par exemple :

une variable quantitative à décrire,
deux variables quantitatives à mettre en relation,
une comparaison entre groupes,
un croisement entre variables qualitatives,
une évolution dans le temps.

À partir de là, il propose :

une sortie principale,
une alternative pertinente,
un commentaire méthodologique structuré,
un niveau de défendabilité locale
et, lorsque c’est nécessaire, une abstention graphique explicite.

Ce que l’outil fait

L’outil peut :

identifier une configuration analytique simple,
recommander une restitution principale,
proposer une alternative,
expliciter ce que le rendu permet de voir,
rappeler ce qu’il ne permet pas de conclure,
signaler un point de vigilance local,
qualifier la défendabilité locale du rendu retenu,
préférer un tableau ou refuser un graphique si la situation l’exige,
l’outil fournit aussi des indicateurs descriptifs complémentaires, dont le coefficient de variation, lorsqu’il est interprétable.

Autrement dit, il ne répond pas seulement à la question :

quel graphique choisir ?

Il répond plus largement à la question :

que faut-il montrer ici, et sous quelle forme ?

Ce que l’outil ne fait pas

L’outil ne remplace pas le raisonnement de l’analyste.

Cet outil :

ne produit pas une interprétation substantielle à votre place,
ne transforme pas automatiquement une configuration en vérité graphique,
ne remplace pas une réflexion méthodologique,
ne décide pas à la place d’un acteur,
ne garantit pas la qualité d’une conclusion parce qu’un rendu est visuellement propre.

Un graphique peut être correct techniquement et faible analytiquement.

Un tableau peut être plus défendable qu’un graphique.

Dans certains cas, aucune visualisation utile ne doit être produite.

Logique de fonctionnement

Le noyau actuel repose sur cinq idées simples :

1. Le choix dépend de l’objectif

Décrire, comparer, montrer une relation ou montrer une évolution ne conduisent pas aux mêmes formes de restitution.

2. Le choix dépend de la nature des variables

Une variable quantitative, une variable qualitative et une variable temporelle n’appellent pas les mêmes traitements.

3. Le choix dépend de la structure locale des données

Effectifs faibles, dispersion quasi nulle, groupes très déséquilibrés, matrice trop large ou série trop courte peuvent rendre un graphique fragile ou peu défendable.

4. Le choix dépend de la lisibilité réelle

Un rendu techniquement possible n’est pas toujours un rendu lisible ou utile.

5. Le choix dépend aussi de la retenue méthodologique

L’outil sait désormais préférer un tableau, produire un placeholder méthodologique ou signaler qu’aucune visualisation utile n’est défendable.

Ce que l’outil produit aujourd’hui

Dans sa version actuelle, l’outil peut produire :

un graphique principal
une alternative pertinente
une explication méthodologique structurée
un niveau de défendabilité locale :
- Bon
- Moyen
- Faible
une doctrine d’abstention graphique distinguant :
- graphique
- tableau
- placeholder
- aucune visualisation utile

le support statistique quantitatif peut maintenant inclure :
- moyenne
- médiane
- dispersion
- coefficient de variation, selon les cas où il est défendable

Pourquoi cette logique importe

Beaucoup d’outils aident à dessiner.

Peu aident à ne pas surinterpréter ce qu’ils dessinent.

L’intérêt de cet outil n’est donc pas seulement graphique.

Il tient au fait qu’il introduit une discipline minimale de restitution :

montrer quand cela éclaire,
simplifier quand cela suffit,
refuser quand cela devient trompeur.

Limites actuelles

Le noyau validé reste volontairement limité.

Il ne couvre pas encore :

tous les types de graphiques possibles
une doctrine complète du tableau
une modulation avancée selon le contexte éditorial
une validation statistique au sens fort
une application autonome plus modulaire

Le coefficient de variation (CV) est pour l’instant un indicateur de support, pas encore un critère moteur de recommandation.

Il faut donc le lire comme un noyau public de première génération, déjà structuré, mais encore appelé à évoluer.

À retenir
Cet outil n’aide pas seulement à choisir un graphique. Il aide à arbitrer une forme de restitution statistique défendable, en tenant compte de l’objectif, des variables, de la lisibilité, de la fragilité locale et de la nécessité éventuelle d’une abstention graphique.

Mode d’emploi rapide

Choisissez d’abord l’objectif analytique : décrire, comparer, montrer une relation ou montrer une évolution.
Importez ensuite vos données, soit par fichier CSV/TSV, soit par copier-coller d’un tableau avec en-têtes.
Vérifiez les colonnes détectées, puis sélectionnez la variable principale et, si nécessaire, une variable secondaire.
Contrôlez ou ajustez le type des variables : quantitative, qualitative ou temporelle.
Cliquez sur Analyser.
Lisez ensuite la sortie retenue, l’alternative, le niveau de défendabilité locale et les points de vigilance.
Utilisez enfin le bloc Support et l’export TXT pour conserver une trace de la recommandation.

Important
L’outil n’interprète pas les données à votre place. Il aide à choisir une forme de restitution défendable, mais ne remplace ni le raisonnement méthodologique ni le jugement analytique.

Si votre CSV est mal lu

L’outil lit les fichiers CSV/TSV et le copier-coller. Si votre fichier contient beaucoup de guillemets ou si les colonnes sont mal reconnues, le plus simple est de le convertir en TSV propre.

Option A (Google Sheets, le plus fiable)
1) Ouvrir Google Sheets → Fichier → Importer → téléverser le CSV.
2) Vérifier le séparateur (auto ou virgule).
3) Fichier → Télécharger → Valeurs séparées par des tabulations (.tsv).
Option B (Excel)
1) Données → À partir d’un fichier texte/CSV → choisir le CSV.
2) Vérifier le délimiteur (souvent virgule), puis Charger.
3) Fichier → Enregistrer sous → Texte (délimité par des tabulations) (*.txt) (option : renommer en .tsv).
Option C (LibreOffice Calc)
1) Ouvrir le CSV dans Calc, valider le séparateur à l’import.
2) Fichier → Enregistrer sous → Texte CSV.
3) Mettre séparateur = tabulation, puis enregistrer.

Contrôle rapide
Une ligne propre doit ressembler à x[TAB]y puis 23[TAB]34, sans guillemets inutiles autour de chaque cellule.

À noter
Si vos données sont déjà bien séparées, vous pouvez aussi les coller directement dans l’outil, avec une première ligne d’en-têtes.

Aide au choix du graphique statistique

Cet outil aide à choisir une forme de restitution statistique défendable à partir d’une configuration simple : description, comparaison, relation ou évolution.

Il ne recommande pas seulement un graphique. Il peut aussi préférer un tableau, produire un placeholder méthodologique ou signaler qu’aucune visualisation utile n’est défendable dans le cas examiné.