Mode d’emploi
Cet outil n’a pas été conçu pour produire un graphique de plus.
Il a été conçu pour aider à construire une restitution statistique proportionnée :
- à un cas,
- à une question,
- à un contexte d’usage
- et à un niveau de prudence.
Autrement dit, il ne répond pas d’abord à la question :
- quelle forme peut-on afficher ?
Il répond d’abord à une question plus exigeante :
- qu’est-il légitime de restituer ici,
- sous quelle forme,
- dans quelles limites,
- et avec quel degré de retenue ?
C’est à partir de cette exigence qu’il faut l’utiliser.
À quoi sert cette page
Cette page n’a pas pour fonction de détailler chaque commande une à une.
Elle sert à fixer la logique correcte d’utilisation de l’outil.
Car un outil de restitution n’est jamais neutre :
- il peut aider à clarifier un cas,
- il peut aussi donner une apparence de solidité à une lecture insuffisamment contrôlée.
La question n’est donc pas seulement de savoir comment l’utiliser, mais comment l’utiliser sans lui faire dire plus que ce qu’il permet réellement.
Cet outil aide à organiser une restitution statistique raisonnée. Il ne sert pas seulement à produire une forme visible, mais à articuler cadrage, contrôle, prudence et, lorsque le cas s’y prête, sortie tabulaire, graphique standard ou graphique spécialisé.
Comment l’utiliser
L’usage de l’outil suit une logique simple.
On commence par cadrer le cas :
- objectif analytique,
- contexte d’usage,
- discipline,
- niveau de prudence.
Ce cadrage n’est pas décoratif. Il conditionne la restitution elle-même.
On charge ensuite les données :
- soit par fichier CSV ou TSV,
- soit par copier-coller d’un tableau avec en-têtes.
Cette opération paraît technique. Elle est en réalité déjà analytique.
Car ce qui est importé n’est jamais “la réalité”, mais :
- une table de travail,
- avec une structure,
- des colonnes,
- des conventions de codage
- et parfois des colonnes techniques comme ID ou Fréquence.
Il faut donc toujours vérifier :
- la qualité du tableau,
- la cohérence des colonnes détectées,
- l’aperçu des premières lignes,
- et les éventuels signaux d’alerte.
Une donnée mal lue produit rarement une erreur spectaculaire.
Elle produit plus souvent une restitution propre, lisible, mais faussement solide.
C’est précisément ce type de confort qu’il faut éviter.
Une fois les colonnes reconnues, on sélectionne :
- la variable principale
- et, si le cas l’exige, une variable secondaire.
Là encore, il ne s’agit pas seulement d’un réglage technique.
Choisir une variable principale, c’est déjà choisir :
- ce que l’on veut faire apparaître comme centre de lecture.
Choisir une variable secondaire, c’est définir la structure :
- de comparaison,
- de relation,
- ou d’évolution que l’on souhaite examiner.
Il faut ensuite vérifier le type attribué à chaque variable :
- quantitative,
- qualitative
- ou temporelle.
Cette étape est décisive.
Une erreur de typage ne fausse pas seulement l’affichage. Elle déplace la logique même de restitution.
Lorsque le cas correspond à un croisement qualitatif, on peut préciser le mode de lecture du tableau croisé :
- effectifs,
- pourcentage du total,
- pourcentage ligne
- ou pourcentage colonne.
Lorsque le cas est relationnel, il faut également préciser la logique relationnelle :
- flow si l’on veut représenter des flux, passages, transferts, circulations
- structure si l’on veut représenter une organisation de liens entre nœuds
Cette distinction est décisive. Elle conditionne le choix entre :
- diagramme de Sankey
- et réseau nœuds-arêtes
L’analyse peut alors être lancée.
Ce que l’outil produit réellement
L’important est ensuite de ne pas s’arrêter à la première sortie visible.
Il ne faut pas lire la première sortie comme un résultat suffisant.
L’outil doit se lire comme un ensemble, il distingue notamment :
- le degré de preuve,
- la base de comptage,
- le support statistique,
- les indices de structure,
- la lecture relationnelle,
- la sortie principale,
- l’éventuelle sortie complémentaire,
- et, dans certains cas, la recommandation spécialisée.
Autrement dit, il ne livre pas simplement un graphique ou un tableau.
Il organise un environnement minimal de lecture.
C’est cette architecture d’ensemble qui fait sa valeur.
Une forme seule « peut impressionner« .
Une forme replacée dans ses conditions de validité devient discutable, donc analytiquement plus sérieuse.
Ce que l’outil prend en charge
L’outil peut intégrer des colonnes techniques comme ID et Fréquence, afin de distinguer des unités uniques ou de traiter certains cas pondérés.
Il peut mobiliser, selon les configurations :
- des statistiques descriptives,
- des tableaux croisés,
- des indicateurs de liaison comme le χ² ou le V de Cramer,
- ainsi que plusieurs indices de structure comme le Gini, le HHI ou l’entropie de Shannon.
Il peut également :
- reconnaître certains cas particuliers
- et orienter vers une sortie spécialisée lorsque cette orientation reste méthodologiquement défendable.
Dans son état actuel, il peut produire notamment :
- courbe de Lorenz,
- heatmap,
- matrice importance × performance,
- courbe de prix psychologique,
- carte de positionnement,
- matrice portefeuille,
- carte concurrentielle,
- diagramme de Sankey,
- réseau nœuds-arêtes,
- courbe de survie / rétention simple.
Il ne le fait jamais comme automatisme pur :
- une recommandation spécialisée n’est pas un verdict,
- c’est une proposition sous conditions.
Ce que signifie une recommandation spécialisée
Lorsque l’outil reconnaît un cas particulier, il peut orienter vers un graphique spécialisé.
Cette orientation ne doit pas être comprise comme une validation automatique.
Elle indique qu’un certain type de forme devient défendable, ou au moins envisageable, sous certaines conditions.
Une recommandation spécialisée ne remplace donc :
- ni la vérification du cas,
- ni le jugement analytique.
Elle signale une possibilité structurée. Elle ne dispense jamais de relire la pertinence de cette possibilité.
Comment utiliser cette page d’exemples de cas
Le « mode d’emploi simplifié » ci-dessous, présente, pour chaque type de graphique pris en charge :
- un cas complet
- une structure de données attendues,
- une logique de sélection
- une logique de lecture correspondante
- un résultat attendu
- et la forme de restitution vers laquelle l’outil peut orienter.
Ce mode d’emploi ne doit pas être utilisé comme un catalogue de recettes.
Il doit être lu comme un ensemble de cas tests permettant de comprendre dans quelles conditions une forme devient :
- recevable,
- discutable,
- ou au contraire peu défendable.
Mode d’emploi simplifié
L’outil ne choisit pas seulement une forme. Il aide à déterminer quelle restitution est défendable selon l’objectif, la structure des variables, le contexte d’usage, le niveau de prudence requis et, pour les cas relationnels, la logique retenue : flux ou structure.
Le principe est toujours le même :
- charger un tableau
- définir l’objectif analytique
- choisir la variable principale
- ajouter, si nécessaire, une variable secondaire
- préciser le type des variables
- indiquer, pour les cas relationnels, la logique retenue si nécessaire
- lancer l’analyse
Selon le cas, l’outil peut produire un tableau, un graphique standard, un graphique spécialisé, ou refuser une visualisation qui serait trompeuse.
1. Décrire une variable quantitative
Si l’objectif est de décrire une variable quantitative, alors la restitution pourra être :
- un tableau descriptif
- un graphique simple de distribution
- dans certains cas, une courbe de Lorenz si la variable décrit une concentration ou une inégalité
Réglage
- Objectif analytique : Décrire
- Variable principale : variable numérique
- Type variable principale : Quantitative
- Variable secondaire : Aucune
Exemple de données
Revenu 1800 2200 2400 2600 3200 4700 8500
Résultat attendu
- tableau descriptif
- graphique de distribution
- si la logique d’inégalité est pertinente : courbe de Lorenz
Capacité actuelle
Pas de plafond codé strict en nombre de lignes. En pratique, ce cas reste confortable tant que le navigateur supporte le volume chargé.
2. Comparer une variable quantitative selon des groupes
Si l’objectif est de comparer une variable quantitative entre plusieurs catégories, alors le graphique pourra être :
- un tableau comparatif
- une boîte à moustaches
Réglage
- Objectif analytique : Comparer
- Variable principale : variable numérique
- Type variable principale : Quantitative
- Variable secondaire : variable de groupe
- Type variable secondaire : Qualitative
Exemple de données
Satisfaction,Segment 6,A 7,A 5,A 8,B 7,B 9,B 4,C 5,C 6,C
Résultat attendu
- tableau comparatif par groupe
- boîte à moustaches
Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 groupes exploitables. En pratique, plus le nombre de groupes est raisonnable, plus la lecture reste claire.
3. Montrer une relation entre deux variables quantitatives
Si l’objectif est de montrer une relation entre deux variables quantitatives, alors le graphique pourra être :
- un tableau des paires
- un nuage de points
- une droite de régression
Réglage
- Objectif analytique : Montrer une relation
- Variable principale : première variable numérique
- Type variable principale : Quantitative
- Variable secondaire : seconde variable numérique
- Type variable secondaire : Quantitative
Exemple de données
Depense_pub,Ventes 10,100 12,115 15,130 18,145 20,160 25,180 30,210
Résultat attendu
- nuage de points
- équation de régression
- corrélation et R²
Capacité actuelle
Pas de plafond codé strict. Il faut au minimum 2 paires exploitables. Le tableau interne des paires affichées dans la page est tronqué visuellement à 30 lignes, mais le calcul peut porter sur davantage.
4. Comparer ou croiser deux variables qualitatives
Si l’objectif est de comparer deux variables qualitatives, alors la restitution pourra être :
- un tableau croisé
- éventuellement une heatmap si la structure matricielle est lisible
Réglage
- Objectif analytique : Comparer ou Montrer une relation
- Variable principale : première variable qualitative
- Type variable principale : Qualitative
- Variable secondaire : seconde variable qualitative
- Type variable secondaire : Qualitative
Exemple de données
Sexe,Marque F,A F,A F,B H,A H,B H,B H,C F,C F,B
Résultat attendu
- tableau croisé
- χ² global, V de Cramer, lecture par case
- éventuellement heatmap
Capacité actuelle
Pas de plafond codé strict en lignes. En revanche, la lisibilité dépend fortement du nombre de modalités. La heatmap devient défendable seulement si la matrice reste lisible.
5. Montrer une évolution dans le temps
Si l’objectif est de montrer une évolution temporelle, alors le graphique pourra être :
- un tableau temporel
- un graphique en ligne
- un graphique en barres selon le cas
Réglage
- Objectif analytique : Montrer une évolution
- Variable principale : variable temporelle
- Type variable principale : Temporelle
- Variable secondaire : quantitative, qualitative, ou aucune selon le cas
Exemple de données
Mois,Chiffre_affaires 01.2025,120 02.2025,130 03.2025,128 04.2025,140 05.2025,155 06.2025,162
Résultat attendu
- tableau temporel
- graphique d’évolution
- variations absolues et relatives
Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 périodes exploitables.
6. Matrice importance × performance
Si l’objectif est de prioriser des objets selon leur importance et leur performance, alors le graphique pourra être une matrice importance × performance.
Réglage
- Objectif analytique : Comparer
- Variable principale : Performance
- Variable secondaire : Importance
- Type principal : Quantitative
- Type secondaire : Quantitative
- Colonne nom de point : facultative mais recommandée
Exemple de données
Critere,Importance,Performance Prix,8,6 Qualite,9,8 Service,7,5 Delai,6,4 Image,5,7
Résultat attendu
- matrice importance × performance
- lecture par quadrants
Capacité actuelle
Pas de plafond codé strict. En pratique, ce cas est lisible avec un nombre modéré de points. Au-delà, les libellés se chevauchent plus facilement.
7. Courbe de prix psychologique
Si l’objectif est d’identifier une zone de prix acceptable, alors le graphique pourra être une courbe de prix psychologique.
Réglage
- Objectif analytique : Comparer
- Le tableau doit contenir les colonnes de logique Van Westendorp
Exemple de données
Trop bon marché,Bon marché,Cher,Trop cher 8,12,18,24 9,13,19,25 10,14,20,27 11,15,21,28 12,16,22,30
Résultat attendu
- courbe de prix psychologique
- zone optimale
- repères OPP, IPP, PMC, PME
Capacité actuelle
Pas de plafond codé strict en lignes. Il faut toutefois assez de réponses pour que les croisements aient un sens. En dessous d’un petit nombre de lignes, la courbe devient très fragile.
8. Carte de positionnement
Si l’objectif est de situer des marques, produits ou acteurs sur deux dimensions perceptuelles, alors le graphique pourra être une carte de positionnement.
Réglage
- Objectif analytique : Montrer une relation
- Deux variables quantitatives
- Une colonne nom de point est recommandée
Exemple de données
Marque,Prix_percu,Qualite_percue A,7,8 B,5,6 C,8,9 D,4,5 E,6,7
Résultat attendu
- carte de positionnement
- lecture relative par quadrants
Capacité actuelle
Pas de plafond codé strict. En pratique, la page de test reste surtout confortable avec un nombre modéré de points nommés.
9. Matrice portefeuille
Si l’objectif est d’arbitrer un portefeuille selon l’attractivité et la compétitivité, alors le graphique pourra être une matrice portefeuille.
Réglage
- Objectif analytique : Comparer
- Deux variables quantitatives
- Une colonne nom de point est recommandée
- Une variable de poids peut être utilisée pour la taille des bulles
Exemple de données
Activite,Attractivite,Competitivite,Volume A,8,7,120 B,6,5,90 C,9,8,150 D,4,3,60 E,7,6,110
Résultat attendu
- matrice portefeuille
- bulles de taille variable
- lecture stratégique par quadrants
Capacité actuelle
Pas de plafond codé strict. En pratique, la lisibilité dépend du nombre de points et de la densité des labels.
10. Carte concurrentielle
Si l’objectif est de comparer un acteur focal à ses concurrents sur deux axes de marché, alors le graphique pourra être une carte concurrentielle.
Réglage
- Objectif analytique : Montrer une relation
- Deux variables quantitatives
- Une colonne nom de point est recommandée
- Une colonne repérant l’acteur focal peut être laissée dans le tableau
Exemple de données
Marque,Prix,Innovation,Focal Marque A,7,8,oui Marque B,6,7, Marque C,8,9, Marque D,5,5, Marque E,4,6,
Résultat attendu
- carte concurrentielle
- mise en évidence de l’acteur focal
- repérage des concurrents directs
Capacité actuelle
Pas de plafond codé strict en lignes. En pratique, la lisibilité graphique dépend du nombre réel d’acteurs affichés.
11. Diagramme de Sankey
Si l’objectif est de représenter des flux entre une origine et une destination, alors le graphique pourra être un diagramme de Sankey.
Réglage
- Objectif analytique : Comparer ou Montrer une relation
- Variable principale : Source ou Origine
- Variable secondaire : Cible ou Destination
- Deux variables qualitatives
- Logique relationnelle : Flux / Sankey
Exemple de données — format liste de flux
Source,Cible Site web,Formulaire Site web,Achat Email,Site web Email,Désinscription Magasin,Achat Magasin,Service client
Exemple de données — format matrice de flux
Source,B,C,D,E,A A,1,1,0,0,0 B,0,0,1,0,0 C,0,0,1,0,0 D,0,0,0,1,0 E,0,0,0,0,1
Résultat attendu
- diagramme de Sankey
- épaisseur des flux proportionnelle au volume observé
- lecture orientée des passages entre sources et cibles
Capacité actuelle
Seuil bloquant explicite : maximum 18 nœuds au total et maximum 60 flux. Au-delà, le rendu est bloqué par le code.
Important
Le Sankey convient lorsque la matrice ou le tableau décrivent avant tout une circulation, un transfert ou un passage entre catégories. La même structure de données peut être lue autrement si l’objectif porte non sur les flux, mais sur l’architecture des liens.
12. Réseau nœuds-arêtes
Si l’objectif est de représenter une structure relationnelle entre acteurs ou catégories, alors le graphique pourra être un réseau nœuds-arêtes.
Réglage
- Objectif analytique : Montrer une relation
- Variable principale : Source
- Variable secondaire : Cible
- Deux variables qualitatives
- Logique relationnelle : Structure / Réseau
Exemple de données — format liste d’arêtes
Source,Cible A,B A,C B,D C,D D,E E,A
Exemple de données — format matrice relationnelle
Source,B,C,D,E,A A,1,1,0,0,0 B,0,0,1,0,0 C,0,0,1,0,0 D,0,0,0,1,0 E,0,0,0,0,1
Résultat attendu
- réseau nœuds-arêtes
- structure orientée minimale
- lecture des nœuds et des liens comme organisation relationnelle
Capacité actuelle
Seuil bloquant explicite : maximum 12 nœuds et maximum 30 arêtes. Au-delà, le rendu est bloqué par le code.
Important
Le réseau nœuds-arêtes convient lorsque la matrice ou le tableau décrivent avant tout une structure relationnelle. Ici, l’intérêt principal n’est pas l’épaisseur des flux, mais la configuration des liens entre nœuds. Une même matrice peut donc être lue soit comme flux, soit comme structure, selon la logique retenue.
13. Courbe de survie / rétention simple
Si l’objectif est de montrer un maintien ou une attrition dans le temps, alors le graphique pourra être une courbe de survie / rétention simple.
Réglage
- Objectif analytique : Montrer une évolution
- Variable principale : variable temporelle
- Type variable principale : Temporelle
Exemple de données
Mois,Clients_actifs 01.2025,100 02.2025,92 03.2025,87 04.2025,79 05.2025,75 06.2025,70
Résultat attendu
- courbe de survie / rétention simple
- lecture de maintien relatif base 100
Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 périodes exploitables.
Important
La courbe de survie ou rétention simple ne doit pas être confondue avec une courbe de Kaplan-Meier. Kaplan-Meier exige une logique explicite de durée, d’événement et de censure, qui n’est pas encore traitée ici comme module complet.
14. Quand l’outil ne doit pas forcer un graphique
Dans certains cas, l’outil peut volontairement :
- préférer un tableau à un graphique
- proposer un placeholder méthodologique
- bloquer une visualisation
Cela peut arriver :
- si les variables sont mal choisies
- si les types ne sont pas cohérents
- si le nombre de cas exploitables est insuffisant
- si la structure du cas ne permet pas une lecture honnête
- si le rendu spécialisé reconnu n’est pas encore suffisamment défendable
Principe général
Si l’objectif est clair, si les variables sont correctement choisies, et si la structure du cas est compatible, alors l’outil peut recommander une restitution adaptée.
Si le cas est mal cadré ou fragile, l’outil doit rester prudent, limiter la forme, ou refuser une visualisation trompeuse.
Si les données sont mal reconnues
Les difficultés de lecture viennent le plus souvent du format du fichier, non de l’analyse elle-même.
Lorsque le CSV contient :
- des séparateurs ambigus,
- des guillemets parasites
- u une structure irrégulière,
le plus sûr est :
- de convertir le fichier en TSV propre,
- ou de coller directement un tableau simple avec en-têtes.
Après chargement, il faut toujours vérifier quatre choses :
- le résumé du dataset,
- l’aperçu des premières lignes,
- les colonnes détectées,
- et le contrôle de cohérence.
Cette vérification doit précéder toute interprétation.
Ce que l’outil ne remplace pas
L’outil n’interprète pas les données à la place de l’analyste.
Il ne transforme pas une structure visible en conclusion automatique.
Il ne remplace :
- ni la formulation correcte du problème,
- ni la qualité de la question posée,
- ni la vérification du dispositif,
- ni le jugement méthodologique
- ni l’examen de la qualité des données,
- ni la discussion des limites.
Il aide à ordonner une restitution. Il ne transforme pas un cas fragile en conclusion robuste.
Une sortie techniquement correcte peut rester analytiquement faible.
Inversement, une restitution très simple peut être plus juste qu’une visualisation plus ambitieuse.
Un cas simple peut exiger plus de retenue qu’un cas apparemment sophistiqué.
C’est pourquoi l’outil doit être compris comme un instrument de cadrage et de restitution, non comme une machine à conclure.
Limites
Les résultats produits doivent toujours être relus à la lumière :
- du contexte d’observation,
- du mode de construction des données,
- de la taille du cas,
- de la structure réelle des effectifs,
- et de la question analytique poursuivie.
Les indicateurs mobilisés par l’outil ne parlent jamais seuls :
- le χ²,
- le V de Cramer,
- le Gini,
- le HHI
- ou l’entropie .
ne valent pas comme verdicts autonomes, Ils valent comme :
- instruments de lecture,
- dans des conditions précises,
- et sous réserve d’un cadrage correct.
Conclusion
La bonne manière d’utiliser cet outil est simple dans son principe, mais exigeante dans sa discipline :
- ne pas lui demander ce qu’il peut dessiner,
- mais lui demander ce qu’il est légitime de restituer.
C’est à cette condition qu’il devient utile.
Non comme producteur automatique de graphiques, mais comme instrument de jugement sur :
- la forme,
- la prudence
- t la transmissibilité d’une restitution statistique.
Le bon usage consiste à traiter l’outil comme un appui au raisonnement.
Il aide à :
- choisir une forme,
- documenter ses conditions,
- signaler ses limites,
- et préparer une formulation transmissible.
Mais il laisse intacte la responsabilité essentielle : celle de savoir ce qu’il est légitime d’avancer à partir des données réellement disponibles.
Pages liées
Pour prolonger la lecture
Assistant de restitution statistique
Outil d’aide à l’arbitrage entre graphique, tableau, restitution dégradée ou abstention.
Graphiques spécialisés
Cas de restitution moins standardisés, plus spécifiques ou plus exigeants.
Mode d’emploi
Présentation du fonctionnement, du cadrage et de l’usage de l’assistant de restitution statistique.
Analyse de survie – Kaplan-Meier
Module spécialisé pour représenter une survie, une rétention ou un temps jusqu’à événement.
Choisir un graphique
Page de cadrage méthodologique pour raisonner avant de choisir une forme de restitution.