Mode d’emploi

Cet outil n’a pas été conçu pour produire un graphique de plus.

Il a été conçu pour aider à construire une restitution statistique proportionnée :

à un cas,
à une question,
à un contexte d’usage
et à un niveau de prudence.

Autrement dit, il ne répond pas d’abord à la question :

quelle forme peut-on afficher ?

Il répond d’abord à une question plus exigeante :

qu’est-il légitime de restituer ici,
sous quelle forme,
dans quelles limites,
et avec quel degré de retenue ?

C’est à partir de cette exigence qu’il faut l’utiliser.

À quoi sert cette page

Cette page n’a pas pour fonction de détailler chaque commande une à une.

Elle sert à fixer la logique correcte d’utilisation de l’outil.

Car un outil de restitution n’est jamais neutre :

il peut aider à clarifier un cas,
il peut aussi donner une apparence de solidité à une lecture insuffisamment contrôlée.

La question n’est donc pas seulement de savoir comment l’utiliser, mais comment l’utiliser sans lui faire dire plus que ce qu’il permet réellement.

À retenir
Cet outil aide à organiser une restitution statistique raisonnée. Il ne sert pas seulement à produire une forme visible, mais à articuler cadrage, contrôle, prudence et, lorsque le cas s’y prête, sortie tabulaire, graphique standard ou graphique spécialisé.

Comment l’utiliser

L’usage de l’outil suit une logique simple.

On commence par cadrer le cas :

objectif analytique,
contexte d’usage,
discipline,
niveau de prudence.

Ce cadrage n’est pas décoratif. Il conditionne la restitution elle-même.

On charge ensuite les données :

soit par fichier CSV ou TSV,
soit par copier-coller d’un tableau avec en-têtes.

Cette opération paraît technique. Elle est en réalité déjà analytique.

Car ce qui est importé n’est jamais “la réalité”, mais :

une table de travail,
avec une structure,
des colonnes,
des conventions de codage
et parfois des colonnes techniques comme ID ou Fréquence.

Il faut donc toujours vérifier :

la qualité du tableau,
la cohérence des colonnes détectées,
l’aperçu des premières lignes,
et les éventuels signaux d’alerte.

Une donnée mal lue produit rarement une erreur spectaculaire.

Elle produit plus souvent une restitution propre, lisible, mais faussement solide.

C’est précisément ce type de confort qu’il faut éviter.

Une fois les colonnes reconnues, on sélectionne :

la variable principale
et, si le cas l’exige, une variable secondaire.

Là encore, il ne s’agit pas seulement d’un réglage technique.

Choisir une variable principale, c’est déjà choisir :

ce que l’on veut faire apparaître comme centre de lecture.

Choisir une variable secondaire, c’est définir la structure :

de comparaison,
de relation,
ou d’évolution que l’on souhaite examiner.

Il faut ensuite vérifier le type attribué à chaque variable :

quantitative,
qualitative
ou temporelle.

Cette étape est décisive.

Une erreur de typage ne fausse pas seulement l’affichage. Elle déplace la logique même de restitution.

Lorsque le cas correspond à un croisement qualitatif, on peut préciser le mode de lecture du tableau croisé :

effectifs,
pourcentage du total,
pourcentage ligne
ou pourcentage colonne.

Lorsque le cas est relationnel, il faut également préciser la logique relationnelle :

flow si l’on veut représenter des flux, passages, transferts, circulations
structure si l’on veut représenter une organisation de liens entre nœuds

Cette distinction est décisive. Elle conditionne le choix entre :

diagramme de Sankey
et réseau nœuds-arêtes

L’analyse peut alors être lancée.

Ce que l’outil produit réellement

L’important est ensuite de ne pas s’arrêter à la première sortie visible.

Il ne faut pas lire la première sortie comme un résultat suffisant.

L’outil doit se lire comme un ensemble, il distingue notamment :

le degré de preuve,
la base de comptage,
le support statistique,
les indices de structure,
la lecture relationnelle,
la sortie principale,
l’éventuelle sortie complémentaire,
et, dans certains cas, la recommandation spécialisée.

Autrement dit, il ne livre pas simplement un graphique ou un tableau.

Il organise un environnement minimal de lecture.

C’est cette architecture d’ensemble qui fait sa valeur.

Une forme seule « peut impressionner« .

Une forme replacée dans ses conditions de validité devient discutable, donc analytiquement plus sérieuse.

Ce que l’outil prend en charge

L’outil peut intégrer des colonnes techniques comme ID et Fréquence, afin de distinguer des unités uniques ou de traiter certains cas pondérés.

Il peut mobiliser, selon les configurations :

des statistiques descriptives,
des tableaux croisés,
des indicateurs de liaison comme le χ² ou le V de Cramer,
ainsi que plusieurs indices de structure comme le Gini, le HHI ou l’entropie de Shannon.

Il peut également :

reconnaître certains cas particuliers
et orienter vers une sortie spécialisée lorsque cette orientation reste méthodologiquement défendable.

Dans son état actuel, il peut produire notamment :

courbe de Lorenz,
heatmap,
matrice importance × performance,
courbe de prix psychologique,
carte de positionnement,
matrice portefeuille,
carte concurrentielle,
diagramme de Sankey,
réseau nœuds-arêtes,
courbe de survie / rétention simple.

Il ne le fait jamais comme automatisme pur :

une recommandation spécialisée n’est pas un verdict,
c’est une proposition sous conditions.

Ce que signifie une recommandation spécialisée

Lorsque l’outil reconnaît un cas particulier, il peut orienter vers un graphique spécialisé.

Cette orientation ne doit pas être comprise comme une validation automatique.

Elle indique qu’un certain type de forme devient défendable, ou au moins envisageable, sous certaines conditions.

Une recommandation spécialisée ne remplace donc :

ni la vérification du cas,
ni le jugement analytique.

Elle signale une possibilité structurée. Elle ne dispense jamais de relire la pertinence de cette possibilité.

Comment utiliser cette page d’exemples de cas

Le « mode d’emploi simplifié » ci-dessous, présente, pour chaque type de graphique pris en charge :

un cas complet
une structure de données attendues,
une logique de sélection
une logique de lecture correspondante
un résultat attendu
et la forme de restitution vers laquelle l’outil peut orienter.

Ce mode d’emploi ne doit pas être utilisé comme un catalogue de recettes.

Il doit être lu comme un ensemble de cas tests permettant de comprendre dans quelles conditions une forme devient :

recevable,
discutable,
ou au contraire peu défendable.

Mode d’emploi simplifié

À retenir
L’outil ne choisit pas seulement une forme. Il aide à déterminer quelle restitution est défendable selon l’objectif, la structure des variables, le contexte d’usage, le niveau de prudence requis et, pour les cas relationnels, la logique retenue : flux ou structure.

Le principe est toujours le même :

charger un tableau
définir l’objectif analytique
choisir la variable principale
ajouter, si nécessaire, une variable secondaire
préciser le type des variables
indiquer, pour les cas relationnels, la logique retenue si nécessaire
lancer l’analyse

Selon le cas, l’outil peut produire un tableau, un graphique standard, un graphique spécialisé, ou refuser une visualisation qui serait trompeuse.

1. Décrire une variable quantitative

Si l’objectif est de décrire une variable quantitative, alors la restitution pourra être :

un tableau descriptif
un graphique simple de distribution
dans certains cas, une courbe de Lorenz si la variable décrit une concentration ou une inégalité

Réglage

Objectif analytique : Décrire
Variable principale : variable numérique
Type variable principale : Quantitative
Variable secondaire : Aucune

Exemple de données

Résultat attendu

tableau descriptif
graphique de distribution
si la logique d’inégalité est pertinente : courbe de Lorenz

Capacité actuelle
Pas de plafond codé strict en nombre de lignes. En pratique, ce cas reste confortable tant que le navigateur supporte le volume chargé.

2. Comparer une variable quantitative selon des groupes

Si l’objectif est de comparer une variable quantitative entre plusieurs catégories, alors le graphique pourra être :

un tableau comparatif
une boîte à moustaches

Réglage

Objectif analytique : Comparer
Variable principale : variable numérique
Type variable principale : Quantitative
Variable secondaire : variable de groupe
Type variable secondaire : Qualitative

Exemple de données

Satisfaction,Segment
6,A
7,A
5,A
8,B
7,B
9,B
4,C
5,C
6,C

Résultat attendu

tableau comparatif par groupe
boîte à moustaches

Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 groupes exploitables. En pratique, plus le nombre de groupes est raisonnable, plus la lecture reste claire.

3. Montrer une relation entre deux variables quantitatives

Si l’objectif est de montrer une relation entre deux variables quantitatives, alors le graphique pourra être :

un tableau des paires
un nuage de points
une droite de régression

Réglage

Objectif analytique : Montrer une relation
Variable principale : première variable numérique
Type variable principale : Quantitative
Variable secondaire : seconde variable numérique
Type variable secondaire : Quantitative

Exemple de données

Depense_pub,Ventes
10,100
12,115
15,130
18,145
20,160
25,180
30,210

Résultat attendu

nuage de points
équation de régression
corrélation et R²

Capacité actuelle
Pas de plafond codé strict. Il faut au minimum 2 paires exploitables. Le tableau interne des paires affichées dans la page est tronqué visuellement à 30 lignes, mais le calcul peut porter sur davantage.

4. Comparer ou croiser deux variables qualitatives

Si l’objectif est de comparer deux variables qualitatives, alors la restitution pourra être :

un tableau croisé
éventuellement une heatmap si la structure matricielle est lisible

Réglage

Objectif analytique : Comparer ou Montrer une relation
Variable principale : première variable qualitative
Type variable principale : Qualitative
Variable secondaire : seconde variable qualitative
Type variable secondaire : Qualitative

Exemple de données

Sexe,Marque
F,A
F,A
F,B
H,A
H,B
H,B
H,C
F,C
F,B

Résultat attendu

tableau croisé
χ² global, V de Cramer, lecture par case
éventuellement heatmap

Capacité actuelle
Pas de plafond codé strict en lignes. En revanche, la lisibilité dépend fortement du nombre de modalités. La heatmap devient défendable seulement si la matrice reste lisible.

5. Montrer une évolution dans le temps

Si l’objectif est de montrer une évolution temporelle, alors le graphique pourra être :

un tableau temporel
un graphique en ligne
un graphique en barres selon le cas

Réglage

Objectif analytique : Montrer une évolution
Variable principale : variable temporelle
Type variable principale : Temporelle
Variable secondaire : quantitative, qualitative, ou aucune selon le cas

Exemple de données

Mois,Chiffre_affaires
01.2025,120
02.2025,130
03.2025,128
04.2025,140
05.2025,155
06.2025,162

Résultat attendu

tableau temporel
graphique d’évolution
variations absolues et relatives

Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 périodes exploitables.

6. Matrice importance × performance

Si l’objectif est de prioriser des objets selon leur importance et leur performance, alors le graphique pourra être une matrice importance × performance.

Réglage

Objectif analytique : Comparer
Variable principale : Performance
Variable secondaire : Importance
Type principal : Quantitative
Type secondaire : Quantitative
Colonne nom de point : facultative mais recommandée

Exemple de données

Critere,Importance,Performance
Prix,8,6
Qualite,9,8
Service,7,5
Delai,6,4
Image,5,7

Résultat attendu

matrice importance × performance
lecture par quadrants

Capacité actuelle
Pas de plafond codé strict. En pratique, ce cas est lisible avec un nombre modéré de points. Au-delà, les libellés se chevauchent plus facilement.

7. Courbe de prix psychologique

Si l’objectif est d’identifier une zone de prix acceptable, alors le graphique pourra être une courbe de prix psychologique.

Réglage

Objectif analytique : Comparer
Le tableau doit contenir les colonnes de logique Van Westendorp

Exemple de données

Trop bon marché,Bon marché,Cher,Trop cher
8,12,18,24
9,13,19,25
10,14,20,27
11,15,21,28
12,16,22,30

Résultat attendu

courbe de prix psychologique
zone optimale
repères OPP, IPP, PMC, PME

Capacité actuelle
Pas de plafond codé strict en lignes. Il faut toutefois assez de réponses pour que les croisements aient un sens. En dessous d’un petit nombre de lignes, la courbe devient très fragile.

8. Carte de positionnement

Si l’objectif est de situer des marques, produits ou acteurs sur deux dimensions perceptuelles, alors le graphique pourra être une carte de positionnement.

Réglage

Objectif analytique : Montrer une relation
Deux variables quantitatives
Une colonne nom de point est recommandée

Exemple de données

Marque,Prix_percu,Qualite_percue
A,7,8
B,5,6
C,8,9
D,4,5
E,6,7

Résultat attendu

carte de positionnement
lecture relative par quadrants

Capacité actuelle
Pas de plafond codé strict. En pratique, la page de test reste surtout confortable avec un nombre modéré de points nommés.

9. Matrice portefeuille

Si l’objectif est d’arbitrer un portefeuille selon l’attractivité et la compétitivité, alors le graphique pourra être une matrice portefeuille.

Réglage

Objectif analytique : Comparer
Deux variables quantitatives
Une colonne nom de point est recommandée
Une variable de poids peut être utilisée pour la taille des bulles

Exemple de données

Activite,Attractivite,Competitivite,Volume
A,8,7,120
B,6,5,90
C,9,8,150
D,4,3,60
E,7,6,110

Résultat attendu

matrice portefeuille
bulles de taille variable
lecture stratégique par quadrants

Capacité actuelle
Pas de plafond codé strict. En pratique, la lisibilité dépend du nombre de points et de la densité des labels.

10. Carte concurrentielle

Si l’objectif est de comparer un acteur focal à ses concurrents sur deux axes de marché, alors le graphique pourra être une carte concurrentielle.

Réglage

Objectif analytique : Montrer une relation
Deux variables quantitatives
Une colonne nom de point est recommandée
Une colonne repérant l’acteur focal peut être laissée dans le tableau

Exemple de données

Marque,Prix,Innovation,Focal
Marque A,7,8,oui
Marque B,6,7,
Marque C,8,9,
Marque D,5,5,
Marque E,4,6,

Résultat attendu

carte concurrentielle
mise en évidence de l’acteur focal
repérage des concurrents directs

Capacité actuelle
Pas de plafond codé strict en lignes. En pratique, la lisibilité graphique dépend du nombre réel d’acteurs affichés.

11. Diagramme de Sankey

Si l’objectif est de représenter des flux entre une origine et une destination, alors le graphique pourra être un diagramme de Sankey.

Réglage

Objectif analytique : Comparer ou Montrer une relation
Variable principale : Source ou Origine
Variable secondaire : Cible ou Destination
Deux variables qualitatives
Logique relationnelle : Flux / Sankey

Exemple de données — format liste de flux

Source,Cible
Site web,Formulaire
Site web,Achat
Email,Site web
Email,Désinscription
Magasin,Achat
Magasin,Service client

Exemple de données — format matrice de flux

Source,B,C,D,E,A
A,1,1,0,0,0
B,0,0,1,0,0
C,0,0,1,0,0
D,0,0,0,1,0
E,0,0,0,0,1

Résultat attendu

diagramme de Sankey
épaisseur des flux proportionnelle au volume observé
lecture orientée des passages entre sources et cibles

Capacité actuelle
Seuil bloquant explicite : maximum 18 nœuds au total et maximum 60 flux. Au-delà, le rendu est bloqué par le code.

Important

Le Sankey convient lorsque la matrice ou le tableau décrivent avant tout une circulation, un transfert ou un passage entre catégories. La même structure de données peut être lue autrement si l’objectif porte non sur les flux, mais sur l’architecture des liens.

12. Réseau nœuds-arêtes

Si l’objectif est de représenter une structure relationnelle entre acteurs ou catégories, alors le graphique pourra être un réseau nœuds-arêtes.

Réglage

Objectif analytique : Montrer une relation
Variable principale : Source
Variable secondaire : Cible
Deux variables qualitatives
Logique relationnelle : Structure / Réseau

Exemple de données — format liste d’arêtes

Source,Cible
A,B
A,C
B,D
C,D
D,E
E,A

Exemple de données — format matrice relationnelle

Source,B,C,D,E,A
A,1,1,0,0,0
B,0,0,1,0,0
C,0,0,1,0,0
D,0,0,0,1,0
E,0,0,0,0,1

Résultat attendu

réseau nœuds-arêtes
structure orientée minimale
lecture des nœuds et des liens comme organisation relationnelle

Capacité actuelle
Seuil bloquant explicite : maximum 12 nœuds et maximum 30 arêtes. Au-delà, le rendu est bloqué par le code.

Important

Le réseau nœuds-arêtes convient lorsque la matrice ou le tableau décrivent avant tout une structure relationnelle. Ici, l’intérêt principal n’est pas l’épaisseur des flux, mais la configuration des liens entre nœuds. Une même matrice peut donc être lue soit comme flux, soit comme structure, selon la logique retenue.

13. Courbe de survie / rétention simple

Si l’objectif est de montrer un maintien ou une attrition dans le temps, alors le graphique pourra être une courbe de survie / rétention simple.

Réglage

Objectif analytique : Montrer une évolution
Variable principale : variable temporelle
Type variable principale : Temporelle

Exemple de données

Mois,Clients_actifs
01.2025,100
02.2025,92
03.2025,87
04.2025,79
05.2025,75
06.2025,70

Résultat attendu

courbe de survie / rétention simple
lecture de maintien relatif base 100

Capacité actuelle
Pas de plafond codé strict. Il faut au moins 2 périodes exploitables.

Important

La courbe de survie ou rétention simple ne doit pas être confondue avec une courbe de Kaplan-Meier. Kaplan-Meier exige une logique explicite de durée, d’événement et de censure, qui n’est pas encore traitée ici comme module complet.

14. Quand l’outil ne doit pas forcer un graphique

Dans certains cas, l’outil peut volontairement :

préférer un tableau à un graphique
proposer un placeholder méthodologique
bloquer une visualisation

Cela peut arriver :

si les variables sont mal choisies
si les types ne sont pas cohérents
si le nombre de cas exploitables est insuffisant
si la structure du cas ne permet pas une lecture honnête
si le rendu spécialisé reconnu n’est pas encore suffisamment défendable

Principe général

Si l’objectif est clair, si les variables sont correctement choisies, et si la structure du cas est compatible, alors l’outil peut recommander une restitution adaptée.

Si le cas est mal cadré ou fragile, l’outil doit rester prudent, limiter la forme, ou refuser une visualisation trompeuse.

Si les données sont mal reconnues

Les difficultés de lecture viennent le plus souvent du format du fichier, non de l’analyse elle-même.

Lorsque le CSV contient :

des séparateurs ambigus,
des guillemets parasites
u une structure irrégulière,

le plus sûr est :

de convertir le fichier en TSV propre,
ou de coller directement un tableau simple avec en-têtes.

Après chargement, il faut toujours vérifier quatre choses :

le résumé du dataset,
l’aperçu des premières lignes,
les colonnes détectées,
et le contrôle de cohérence.

Cette vérification doit précéder toute interprétation.

Ce que l’outil ne remplace pas

L’outil n’interprète pas les données à la place de l’analyste.

Il ne transforme pas une structure visible en conclusion automatique.

Il ne remplace :

ni la formulation correcte du problème,
ni la qualité de la question posée,
ni la vérification du dispositif,
ni le jugement méthodologique
ni l’examen de la qualité des données,
ni la discussion des limites.

Il aide à ordonner une restitution. Il ne transforme pas un cas fragile en conclusion robuste.

Une sortie techniquement correcte peut rester analytiquement faible.

Inversement, une restitution très simple peut être plus juste qu’une visualisation plus ambitieuse.

Un cas simple peut exiger plus de retenue qu’un cas apparemment sophistiqué.

C’est pourquoi l’outil doit être compris comme un instrument de cadrage et de restitution, non comme une machine à conclure.

Limites

Les résultats produits doivent toujours être relus à la lumière :

du contexte d’observation,
du mode de construction des données,
de la taille du cas,
de la structure réelle des effectifs,
et de la question analytique poursuivie.

Les indicateurs mobilisés par l’outil ne parlent jamais seuls :

le χ²,
le V de Cramer,
le Gini,
le HHI
ou l’entropie .

ne valent pas comme verdicts autonomes, Ils valent comme :

instruments de lecture,
dans des conditions précises,
et sous réserve d’un cadrage correct.

Conclusion

La bonne manière d’utiliser cet outil est simple dans son principe, mais exigeante dans sa discipline :

ne pas lui demander ce qu’il peut dessiner,
mais lui demander ce qu’il est légitime de restituer.

C’est à cette condition qu’il devient utile.

Non comme producteur automatique de graphiques, mais comme instrument de jugement sur :

la forme,
la prudence
t la transmissibilité d’une restitution statistique.

Le bon usage consiste à traiter l’outil comme un appui au raisonnement.

Il aide à :

choisir une forme,
documenter ses conditions,
signaler ses limites,
et préparer une formulation transmissible.

Mais il laisse intacte la responsabilité essentielle : celle de savoir ce qu’il est légitime d’avancer à partir des données réellement disponibles.

Pages liées

Outils – Mode d’emploi « Assistant de restitution statistique »

Mode d’emploi

À quoi sert cette page

Comment l’utiliser

Ce que l’outil produit réellement

Ce que l’outil prend en charge

Ce que signifie une recommandation spécialisée

Comment utiliser cette page d’exemples de cas

Mode d’emploi simplifié

1. Décrire une variable quantitative

2. Comparer une variable quantitative selon des groupes

3. Montrer une relation entre deux variables quantitatives

4. Comparer ou croiser deux variables qualitatives

5. Montrer une évolution dans le temps

6. Matrice importance × performance

7. Courbe de prix psychologique

8. Carte de positionnement

9. Matrice portefeuille

10. Carte concurrentielle

11. Diagramme de Sankey

12. Réseau nœuds-arêtes

13. Courbe de survie / rétention simple

14. Quand l’outil ne doit pas forcer un graphique

Si les données sont mal reconnues

Ce que l’outil ne remplace pas

Limites

Conclusion

Pour prolonger la lecture

Assistant de restitution statistique

Graphiques spécialisés

Mode d’emploi

Analyse de survie – Kaplan-Meier

Choisir un graphique