Outils – NON – Visualiser les données

À quoi sert cette page

Un graphique statistique n’est ni un habillage, ni une réponse automatique d’un logiciel. C’est une décision de représentation.

Dans une perspective configurationnelle, la bonne question n’est pas :

  • Quel graphique vais-je utiliser ?

Elle est :

  • Que devez-vous rendre lisible, pour quel lecteur, dans quel but, et sous quelles contraintes ?

À retenir

Un graphique statistique est une décision de représentation, pas une sortie automatique. La bonne question est : quelle solution (graphique, tableau, texte, abstention) est la plus pertinente pour un acteur, un besoin et un contexte donnés.

Le point de départ : problème ≠ solution

Une erreur fréquente consiste à partir directement de la solution :

  • on a des données,
  • on ouvre Excel,
  • on choisit un graphique.

Or le « besoin » n’est presque jamais “faire un graphique”. Le « problème à réguler » est peut être de :

  • comparer,
  • décrire une structure,
  • suivre une évolution,
  • rendre visible une distribution,
  • repérer une relation,
  • synthétiser un résultat,
  • réduire une incertitude,
  • soutenir une lecture prudente.

Le graphique n’est qu’une solution possible parmi d’autres. Selon les cas, la solution la plus robuste peut être :

  • un graphique,
  • un tableau,
  • un texte interprétatif,
  • une combinaison de plusieurs formes,
  • ou une abstention provisoire si aucune représentation honnête n’est possible.

Une lecture configurationnelle de la décision graphique

L’approche adoptée dans se site implique qu’une décision n’est jamais isolée :

  • décision = f(acteur, solutions, contexte)

Appliqué à la représentation statistique :

  • décision graphique = f(acteur, besoin informationnel, solutions de représentation, contexte, contraintes, risques)

Cette formule impose une discipline : un graphique se juge dans une configuration, pas “en soi”.

1) L’acteur

Un graphique est produit par quelqu’un, pour quelqu’un.

Le niveau de technicité acceptable, le temps de lecture et l’usage attendu changent la forme pertinente.

Un même contenu ne se représente pas de la même manière pour :

  • un décideur,
  • un étudiant,
  • un lecteur académique,
  • un public général,
  • un commanditaire.

2) Le besoin informationnel

Le problème à réguler n’est pas une “forme”.

Il correspond à une opération :

  • comparer,
  • expliquer,
  • explorer,
  • surveiller,
  • enseigner,
  • publier,
  • convaincre,
  • alerter.

Une visualisation exploratoire n’obéit pas aux mêmes contraintes qu’une visualisation destinée à publier ou à convaincre.

3) Les solutions concurrentes

Dans cette approche, les formes visuelles sont des solutions en concurrence :

  • barres,
  • histogramme,
  • courbe,
  • nuage de points,
  • carte,

Mais aussi :

  • tableau,
  • texte,
  • ou absence provisoire.

La question n’est donc pas seulement : “quel graphique ?”

Elle est :

  • quelle solution de représentation régule le mieux le besoin dans cette configuration ?

4) Le contexte

Le contexte inclut notamment :

  • la structure des données (qualitatives, quantitatives, temporelles, spatiales, relationnelles),
  • leur qualité et leur comparabilité,
  • le support (site, rapport, slides, publication),
  • les contraintes éditoriales,
  • le niveau de détail requis,
  • le temps de lecture disponible,
  • les risques d’interprétation.

Le “marché” des solutions de représentation

Dans le cadre de ce site, on peut raisonner en termes de marché des solutions :

  • le problème à réguler est un problème de lisibilité, de comparaison, de compréhension ou de preuve,
  • les solutions sont les formes de représentation possibles,
  • la concurrence ne se limite pas aux graphiques entre eux : elle oppose aussi le graphique au tableau, au texte, ou à l’abstention.

Ainsi, un diagramme en barres n’est pas seulement en concurrence avec une courbe. Il peut être en concurrence avec un tableau lorsque la précision prime sur l’effet de synthèse.

Pourquoi tant de graphiques sont faibles

Beaucoup de graphiques sont faibles non parce qu’ils sont mal “dessinés”, mais parce qu’ils sont mal pensés :

  • automatisme logiciel,
  • mimétisme,
  • préférence esthétique,
  • absence de problème à réguler explicite,
  • non-contrôle des risques.

On retrouve alors des erreurs récurrentes :

  • une courbe pour une variable nominale,
  • des axes tronqués sans justification,
  • des groupes non comparables présentés comme comparables,
  • une confusion corrélation-causalité,
  • une forme inadéquate pour une distribution,
  • une sophistication qui masque la fragilité des données.

Dans tous ces cas, le mécanisme est le même :

  • la solution a été choisie avant d’avoir construit correctement le problème de représentation.

Quatre opérations distinctes

Une pratique rigoureuse de la visualisation suppose de distinguer quatre opérations.

1) Diagnostiquer

Qualifier la situation avant de produire :

  • quelles données,
  • quel besoin informationnel,
  • quel lecteur,
  • quel objectif,
  • quelles solutions concurrentes plausibles,
  • quels risques d’erreur ou de surinterprétation.

2) Produire

Construire la solution retenue avec discipline :

  • forme adaptée à la structure des données,
  • ordre cohérent,
  • échelles honnêtes,
  • lisibilité,
  • titres utiles,
  • annotations pertinentes,
  • source, période, unité, champ, N lorsque nécessaire.

3) Valider

Contrôler l’adéquation entre :

  • données et forme,
  • objectif et lecture produite,
  • comparabilité réelle et comparabilité suggérée,
  • ce que le graphique montre et ce que vous en dites.

4) Commenter

Discipliner l’interprétation en distinguant :

  • ce que le graphique montre,
  • ce qu’il permet de comparer,
  • ce qu’il suggère,
  • ce qu’il ne permet pas de conclure,
  • les hypothèses possibles,
  • les limites.

La prudence méthodologique fait partie de la méthode

Une méthode sérieuse doit aussi savoir :

  • écarter une solution inadéquate,
  • suspendre une recommandation,
  • préférer un tableau,
  • demander des informations complémentaires,
  • reconnaître qu’aucune représentation n’est satisfaisante en l’état.

Dire “je ne recommande pas de graphique ici” n’est pas un échec. C’est un signe de rigueur.

Graphique et tableau : pas une hiérarchie, un arbitrage

On oppose souvent graphique et tableau comme si le premier était moderne et le second secondaire. Cette opposition est pauvre.

  • Le tableau est supérieur lorsque la précision et la densité priment.
  • Le graphique est supérieur lorsque la perception rapide d’une structure, d’une évolution, d’une dispersion ou d’une relation est l’objectif central.

Le bon choix dépend de leur capacité respective à répondre au problème à réguler dans la configuration considérée.

En résumé

Un graphique statistique n’est ni un réflexe logiciel, ni une simple illustration.

C’est une solution de représentation choisie parmi d’autres pour répondre à un besoin dans une configuration donnée.

Le raisonnement correct n’est pas :

  • “J’ai des données, quel graphique puis-je faire ?”

Il est :

  • “Quel problème de lecture dois-je traiter, quelles solutions sont en concurrence, et laquelle est la plus pertinente ici ?”

Pour aller plus loin

  • Choisir un graphique (page opérationnelle : passer du besoin à une solution de représentation adaptée)
  • Erreurs fréquentes en visualisation statistique
  • Valider un graphique avant publication
  • Commenter un graphique sans surinterpréter
  • Graphique, tableau ou abstention

Outil de décision graphique

Partir du problème, puis arbitrer entre solutions (graphique, tableau, texte, combinaison, abstention), avec trace explicative.

Questionnaire (version courte)

Mode avancé (questions supplémentaires)

Ces champs déclenchent des règles plus fines (barres vs points vs boxplot, abstention provisoire, etc.).

Seuils (paramétrables)