Les assiettes volantes

Vous connaissez certainement ce numéro de cirque qui s'appelle les assiettes volantes ? Il s'agit de faire tourner sur des tiges flexibles des assiettes, le plus possible et sans qu'aucune ne tombe. On se prend à partager l'envie d'en rajouter encore et encore, conjugué avec une crainte grandissante de voir une assiette tomber. Le stress grandit avec le nombre d'assiettes en vol. Le numéro devient rapidement jubilatoire: une course effrénée entre les nouvelles assiettes à mettre en mouvement et celles qui oscillent dangereusement vers la chute. On hésite entre vouloir le succès de la tentative et l'envie d'entendre des assiettes se briser, car on sent bien que l'artiste sur-joue l'urgence et la panique.


image

Beaucoup de chefs d'entreprise que je rencontre me disent avoir l'impression de faire ce numéro tous les jours et 24/24. Les assiettes étant n'importe quel sujet critique: la trésorerie, les stocks, les ventes, un impayé, la démission soudaine d'un collaborateur, ou un message du banquier sur le répondeur.

Levez la main ceux qui voit leur travail comme une succession de sprints vers la prochaine assiette qui va tomber.

Les indicateurs stratégiques

perceptible.fr aide le chef d'entreprise à identifier ses indicateurs stratégiques. Ceux qui permettent de projeter l'activité et de décider concrètement ce qui est le plus urgent à faire aujourd'hui pour préparer demain.

Pour le marchand de glace, par exemple, ce sont la météo à 4 jours et les prix de ses concurrents dans un rayon de 500 m.

La représentation visuelle

Les chiffres sont utiles comme référence, mais ils peuvent aussi être un obstacle à la compréhension et à l'action. Le tableau de chiffres qui tient à jour en temps réel les coordonnées et vitesses angulaires des assiettes décrit complètement la situation mais n'est d'aucune utilité immédiate à la décision.

Il faut plutôt un plan avec des minuteurs graphiques à la position de chaque assiette qui affichent le temps restant avant la chute.

Tableau de bord à partir des bilans successifs

Les indicateurs stratégiques sont des choses très personnelles uniques à chaque entreprise. Il existe néanmoins un niveau commun à toutes les entreprises: la finance.

perceptible.fr offre un service de Diagnostic PME qui permet à partir de 3 à 5 bilans de visualiser les engrenages financiers qui transforment les commandes gagnées en: achat de matières premières, marge, valeur ajoutée, salaires, impôts et finalement rentabilité des capitaux propres. L'ambition est d'abord d'expliquer les pourquoi de la trajectoire, .... puis de prédire et d'ajuster.

Elles sont mises à la queue leu leu sur plusieurs exercices pour faire apparaître les trajectoires des éléments clés. Ceux qui répondent aux questions importantes:

  • Où se joue la rentabilité de l'entreprise ?,
  • Cette baisse (résultat, valeur ajoutée, marge brute, ...) est elle le reflet de la diminution des commandes ou d'une moindre performance interne ?,
  • Où se trouve le goulet d'étranglement ?,
  • ...

C'est la mise en lumière des indicateurs comparables: Production par personne, part de la sous-traitance ou des moyens techniques, Valeur Ajoutée/ Production, ... qui permettent de comprendre les causes et leurs enchainements jusqu'au bénéfice ou la perte de l'exercice en cours. Ces mêmes indicateurs sont aussi les bras de levier permettant d'agir sur le futur: imaginer, simuler et décider les changements pour atteindre l'objectif.

Diagnostic PME

perceptible.fr propose un service de diagnostic PME non intrusif qui, à partir de 1 à 3 liasses fiscales de l'entreprise, fournit un rapport visuel de l'évolution des paramètres clés.
Pour tout renseignement: alain.roan@perceptible.fr


Infos'travaux


Hack The City

Fin mai, un événement Hack The City était organisé au sein de la Mélée Numérique. Expérience très intéressante et énergisante. Une dizaine de projets autour de la ville ont travaillés pendant un Hackaton de 36 heures: concept, business model, plan de financement, prototypage, ...
Le moniteur.fr décrit l'évènement en détails.
Le jury a récompensé 4 projets.

Le projet Infos'travaux

J'ai participé à l'équipe Infos'travaux qui a défini et prototypé une application mobile et web permettant aux riverains et aux usagers de la ville de tout savoir sur les chantiers de la ville:

  • nature du chantier, durée prévue, ...
  • itinéraires bis: voiture, piéton, PMR, livraison, ...
  • prévisions de chantiers, de nuisances, ...
  • abonnement aux flux d'informations d'un chantier ou d'une zone

Ce projet est arrivé 2ieme.

Tableau de bord des Chantiers

Les données ouvertes de la ville de Toulouse sur les chantiers, et l'application Tableau Software Public permettent de construire simplement un tableau réactif qui aide à mieux comprendre que sont les chantiers de l'agglomération. Version pour ordinateur de bureau.


Il y a d'abord des données statiques:
  • nombre des chantiers
  • répartitions
  • carte avec la position des chantiers
Puis des bulles qui apparaissent quand le curseur survole un des cercles sur la carte et qui fournit:
  • la nature des travaux
  • l'impact sur la circulation
  • les dates de début et de fin
Et enfin une capacité d'interaction qui permet par le jeu des filtres Nature, Durée ou Entreprise, de poser des questions qui combinent plusieurs dimensions:
  • Où se situent les chantiers de Voirie ?
  • Combien de chantiers de Telecom de la société X sont ils en cours ?
  • Quels sont les chantiers qui durent le plus longtemps ?
  • ...
Quelques points saillants:
  • il n'y a pas de camembert pour représenter la répartition par catégories mais des barres horizontales triées
  • le filtre s'effectue par sélection directe sur la donnée
  • l'appel à Google Map à partir des coordonnées GPS

Peut on distinguer un écart dû au hasard d'une sur ou sous-performance ?

C'est une question récurrente quand on parle de série chronologique de valeurs issue d'un processus (ventes, défauts, visites, abonnements, temps de livraison, ...) :
Tous les tableaux de bord affichent des séries de données. Tous les managers se saisissent de la valeur la plus récente et la compare à:

  • la valeur précédente
  • la valeur de l'an dernier à la même époque
  • l'objectif
  • l'avance/retard sur le cumulé à date
  • ....

Positif ? Négatif ? En pourcentage ?
Et là les ennuis commencent !! Faut il interpréter cet écart comme une variation de performance ou un simple bruit résultat de conjonction d'événements hors de tout contrôle et somme toute normal ?


Une variation n'est pas forcement un signal
et plus insidieux
Une stagnation est peut être un signal

Beaucoup d'indicateurs utilisent les flèches haut/bas qui disent la variation avec la valeur précédente. C'est malheureusement une fausse bonne idée quand on l'applique sur une série chronologique soumise à des variations aléatoires.
Combien de réunions de crise ou de célébrations ont été organisées sur la base de simples écarts à la moyenne ? Et à l'inverse combien auraient dues être organisées si une variation aléatoire n'avait pas masquée une tendance lourde à laquelle il aurait fallu réagir immédiatement ?

Le Process Behavior Chart

Inventé par Walter A. Shewhart en 1924 ce diagramme fait partie du domaine du Statistiscal Process Control. Repris par Deming, il est exploité dans beaucoup de démarches qualité (6 sigma).
D'une simplicité désarmante, très robuste et d'une large applicabilité, cette technique prend la forme d'un graphe double qui rend visible les caractéristiques du processus. Il peut s'utiliser au fil de l'eau ou à posteriori. Cette approche, pas très jeune, est modeste dans ses ambitions. Il n'y a pas volonté de prévoir ou d'expliquer, seulement d'observer, de constater et de s'ajuster. Regardons ce qu'il est possible d'en tirer. Le plus simple n'est il pas le meilleur ? Ou au moins à essayer en premier ?

La détection des valeurs anormales

Le signal est tracé sur sa moyenne (en pointillé) et est entouré d'une zone de variation "normale" (en bleu clair). Si un point en sort, il est dit "aberrant" (en rouge), un accident, un évènement exceptionnel, ... ou le signe précurseur d'un changement dans le processus de production des données ?

C'est là que le management peut lancer à juste titre une réunion d'analyse des causes.
La largeur de la zone bleue est calculée à partir du signal lui même, elle est proportionnelle à la moyenne des variations d'une valeur à la suivante.

La détection de changements des caractéristiques du processus

Le diagramme permet de voir que le signal est en train de diverger de son gabarit calculé. Il propose un critère précis: l'apparition de 8 points successifs du même coté de la moyenne (en orange) indique que le signal a changé de mode et qu'il faut recalculer la moyenne et la zone de variation pour pouvoir continuer à l'interpréter correctement.

Le diagramme se transforme en une succession de moyennes et de zones admissibles qui donne un recul très informatif sur les données de base. L'œil se décolle de la courbe des valeurs individuelles et découvre le paysage global. Les bonnes questions surgissent: Pourquoi le signal a t il changé de nature à ce moment ? Est ce corrélé à un autre changement ? Pourquoi autant de hausse ? de baisse ?


Le diagramme complet

Le Process Behavior Chart est en réalité double: Le signal comme vu précédemment et en dessous le diagramme de la suite des sauts entre valeurs successives.

Le même procédé (moyenne, zone de variation, ...) s'applique à ce diagramme des variations et pour être complet, les valeurs aberrantes et les changements du processus, doivent se lire sur les deux diagrammes simultanément. Une valeur est aberrante si sa valeur s'écarte trop de la moyenne OU si la différence avec la valeur précédente est anormale. C'est aussi valable pour la détection d'un changement de mode à faire sur l'un OU l'autre des diagrammes. Sur l'exemple, le signal oscille autour de la moyenne, il ne déclenche pas la couleur orange. Par contre la diminution de l'amplitude de ses variations déclenche le critère des 8 points consécutifs sous la moyenne dans le diagramme du bas.
Après 10 minutes de formation, un néophyte complet est capable de lire et de raisonner sur un Process Behavior Chart.

Une référence lisible sans aucun bagage statistique que je recommande: Wheeler, Donald J. (2000). Understanding Variation: the key to managing chaos.


La facture de téléphone des adolescents (2)


De nouvelles questions... et les réponses

Le précédent billet décrit l'analyse des données journalières et horaires d'envois de SMS.


Malgré le fait que toutes les données sont sur la table, certaines questions utiles n'ont pas de réponses directes. La première tout à fait dans le prolongement des données présentées: « Quel est le volume global par mois ? Augmente t-il ? Baisse t-il ? »

Cette question tout à fait valide peut être répondue élégamment en enrichissant l'indicateur visuel pour superposer la journée et le mois qui devient une zone ombrée en arrière plan.
Au passage, la codification (bleu=semaine, gris=week-end) se transforme en (bleu=yaécoledemain, gris=grassematpossible) bien plus efficace pour l'analyse et ... la décision.

De nouvelles représentations interactives

Mais d'autres questions restent inaccessibles à ce mode de visualisation. Par exemple:
  • Les envois de SMS après 23 heures les jours de semaine ont ils baissés depuis la rentrée scolaire ?
  • Y a t il beaucoup d'émissions de SMS durant les heures de cours ?
  • Quel est le jour de la semaine d'émission du plus grand nombre de SMS ?
  • ...
D'où l'idée d'un tableau de bord plus dédié qui utilise html5 (Visible qu'avec un navigateur récent: firefox, chrome, safari, internet explorer>=9, .... ). En jouant sur la sélection des données sur les trois panneaux, il est possible de répondre aux trois questions précédentes. Saurez vous le faire ?

Voir la sécurité



Deux échelles de temps

La sécurité a deux dimensions temporelles:

  • l'année, le semestre, le trimestre: la planification réalisée pour mettre en place la stratégie de sécurité (les mesures concrètes à appliquer, les moyens à utiliser) déduite de l'analyse des risques (ce qu'il faut protéger, contre quoi, à quel prix)
  • le temps réel, la journée, la semaine: la veille en continue qui permet de:
    1. vérifier que les mesures décidées sont correctement mises en œuvre
    2. piloter l'exécution des contre-mesures appropriées pour parer les attaques d'une part et pour colmater les failles qui apparaissent d'autre part


La veille

Intéressons nous aux vulnérabilités. Techniquement la surveillance est assurée par un scanner qui teste de manière périodique chaque machine du réseau vis à vis d'une liste de vulnérabilités connues: applications installées sans les derniers correctifs de sécurité, ports ouverts sans raison, mot de passe par défaut, ...

La question périodique est: A t-on détecté des vulnérabilités dangereuses ?
Oui -> enclencher au plus vite une correction adéquate. Non -> passer à autre chose...
- « Non ?...»
- « Non, ...enfin, pas depuis la dernière fois que l'on a vérifié... »
Et là bien sûr, une foule d'autres questions et ... de jurons surgissent...
Le plus souvent une donnée n'est pas connue à tout instant mais fait l'objet d'une ronde régulière. Et il arrive que des machines ne soient pas accessibles ou éteintes au moment de l'essai de vérification. Le dispositif de surveillance peut aussi être en panne. En pratique, il faut savoir se contenter de la dernière valeur observée et de l'âge de l'observation. Cet âge devient une donnée à part entière utile pour 1) juger de la fraicheur de l'information et 2) déclencher lui même des alarmes.

Echelle des alarmes

Les deux dimensions (intensité et âge/confiance) se combinent sur une échelle unique de gravité progressive. Que la dernière vérification d'une machine date de 15 jours est fâcheux (orange), mais il est certainement plus grave de constater qu'une correction de vulnérabilité n'est toujours pas effectuée après le délai prévu (noir).


Les niveaux sont précisément définis par les seuils de vulnérabilité et les délais de réaction que fixe la politique de sécurité.

L'alarme et son contexte

Une alarme attire l'attention et invite à la décision rapide, elle doit donc aussi fournir suffisamment de contexte pour prendre la bonne décision.
En complément de l'alarme figurée par son code couleur, l'historique permet de répondre aux questions sur son évolution récente:

  • « depuis combien de temps cette alarme est elle enclenchée ? »
  • « la situation est elle en train de s'améliorer ou d'empirer ? »
  • ...

Disposer les machines les unes sous les autres permet de distinguer des schémas se produisant simultanément sur plusieurs machines:

  • « est ce un cas isolé, ou la manifestation d'un phénomène plus large ? »
  • ...


Comment lire l'indicateur:
  • la première colonne synthétise l'état de l'indicateur à la date du jour (15/5) pour chaque machine
  • deux machines ont des vulnérabilités non tolérables, et pour celle en noir, il y a du retard de correction
  • l'historique dans la partie droite synthétise l'évolution sur les 4 dernières semaines
  • les quatre barres noires successives à droite de la Bureautique comptabilité Lyon indique qu'une correction aurait due être effectuée il y a déjà quatre jours
  • le schéma est la signature que la vérification n'a pas pu s'effectuer correctement pendant plusieurs jours consécutifs, on passe de blanc à gris, puis à orange après 3 jours. Le fait que le schéma se répète sur plusieurs lignes à la même date indique qu'il s'agit probablement d'un problème technique du côté du dispositif de scan.


L'œil décode sans effort la situation

Les bénéfices de la visualisation sont:

  • ne sont présentées que les informations qui sollicitent une réaction. Si tout va bien, tout est blanc.
  • le code couleur (gris, orange, rouge, noir), en redondance avec la taille des barres induisent un sens de la gravité évident même en l'absence de la légende exacte
  • les contextes temporel (évolution récente) et de voisinage (les autres machines) fournissent une grille de décodage très riche

Le responsable (y compris non technique) peut sans effort obtenir des réponses aux deux questions importantes concernant les vulnérabilités:

  • Surveille t-on suffisamment les vulnérabilités du parc de machine ?
  • Corrige t-on en temps utile les vulnérabilités détectées ?

Ainsi que les preuves factuelles de ces réponses.


Un cas de big data domestique


L'indicateur n'est pas l'objectif

J'ai croisé très récemment un cas concret où un indicateur que l'on croyait être l'objectif disparait et qu'il faille en reconstruire d'autres mais que l'abondance des données de base rende la tâche ... challenging: il s'agit de la facture de téléphone d'adolescents.

Il y a encore pas longtemps, l'indicateur de pilotage utilisé par les parents était: le coût mensuel en €. Le montant du forfait de base ayant été âprement négocié et ne changeant pas d'un mois sur l'autre, c'était l'éventuel dépassement en € qui servait d'indicateur. Ou la fréquence d'achat de cartes prépayées pour les plus prudents.

L'arrivée des forfaits Free à 2€ incluant 2 heures de voix et sms illimités vient perturber les habitudes. L'indicateur mensuel de coût des dépassements reste valable pour la voix. Pour les sms gratuits, il faut dé scotcher de l'ancien indicateur, le véritable objectif paternaliste qui pourrait être quelque chose comme: "Encourager l'usage raisonné du portable".

Les factures mensuelles contiennent la liste chronologique des sms, le numéro destinataire (sans les quatre derniers chiffres) et l'heure d'émission. Seul problème, trois mois de factures représentent plus de 5500 lignes sur 98 pages. Chaque ligne est parfaitement lisible mais le schéma global est complétement invisible. Un cas de Big Data domestique en quelque sorte.





Convertir les factures pdf en excel

De nombreux services web gratuits offrent la conversion de pdf en xls. La conversion est parfois déficiente et nécessite des ajustements manuels de mise en page, mais il suffit de quelques minutes pour avoir toutes les lignes dans excel. En plaçant des noms de colonnes appropriés, un tri sur la date et l'heure permet de regrouper les lignes utiles et d'éliminer les hauts et pieds de page.


Quels indicateurs ?

Les indicateurs se déduisent des questions que tout parent se posent, la plus globale est : «L'utilisation journalière est elle raisonnable ?»

D'abord en quantité. Le nombre est indiqué en haut de la facture (plusieurs milliers pour un mois) reste une grandeur vaguement abstraite que l'on divise mentalement par 30 jours pour se faire une idée concrète. Mais il faudrait connaitre les valeurs par jour de la semaine. La tolérance en semaine et en weeend n'est pas la même.

Le deuxième indicateur à bâtir doit répondre à la partie qualitative de la question: «Les moments d'utilisation sont ils compatibles avec la scolarité ?»


Quelle visualisation ?

Pour la quantité d'utilisation journalière, un diagramme en barres chronologique sera parfait. Une couleur pour les jours de la semaine, une autre pour les weekends. L'axe des Y peut être en nombre émis ou en équivalent durée de composition. Prenons par exemple 15 secondes par sms (les ados sont rapides mais il faut aussi tenir compte du temps de lecture des sms reçus qui sont invisibles sur la facture mais forcement présents dans un ordre de grandeur similaire). On obtient tout de même un pic à 60 minutes pour la journée du 23 mars.

Pour les instants d'émission, l'idée la plus simple est de visualiser chaque sms par un point sur un axe vertical de 24h. Une subtilité toutefois, pour éviter que les sms après minuit passent au jour d'après et brouillent la lecture des soirées tardives, il faut créer une ligne de changement de jour, j'ai choisi ici 03:00. On constate de nombreux envois au delà de la barre des 22:30 et même une émission à 5:30 du matin le dimanche 31 mars.

Une meilleure étiquette énergie


Indicateurs hétérogènes, visualisation unique

A partir de 1992 l'Europe a introduit une échelle colorée d'efficacité énergétique sur l'étiquette de chaque appareil électroménager: réfrigérateur, lave-linge, four, climatiseur, ampoule, ... et étendu plus récemment à l'automobile et à l'immobilier.








Bien entendu les échelles et niveaux sont propres à chaque catégorie d'appareil. Les voitures sont évaluées en niveau de CO2/km, les grille pain en efficacité énergétique ainsi que les climatiseurs mais sur d'autres échelles.

Toutes choses égales par ailleurs, le résultat est livré au consommateur sur la même échelle à 7 niveaux pour éclairer son choix (ou plus récemment 10 avec des A+, A++ et A+++).

Critique de la visualisation

Plusieurs remarques:

  • l'échelle est représentée par plusieurs grandeurs redondantes: la lettre, la couleur, la taille des barres horizontales, la position. La redondance n'est pas forcément une mauvaise chose, mais là c'est beaucoup. Tutfe dirait que le rapport quantité donnée/quantité encre est faible.
  • la direction de l'échelle: Les étiquettes des catégories A, B, ... donne une indication sur le sens de lecture: A c'est mieux que B qui est mieux que C, ... La couleur vient confirmer cet implicite. Tout le monde sait que vert c'est mieux que rouge.
  • malgré les barres horizontales qui s'agrandissent, l'échelle n'est pas graduée. Il n'est pas possible de savoir «Combien de fois plus d'énergie pour G que pour A ?»
  • l'aiguille qui indique la valeur est un curseur noir lui même redondant: 1) il est positionné en face du niveau de l'échelle. 2) il indique la valeur par une lettre en blanc sur noir
  • la valeur est paradoxalement moins visible que l'échelle multicolore. Cette faiblesse éclate au grand jour face à plusieurs étiquettes simultanément. Sur la vitrine d'une agence immobilière l'œil aperçoit très bien le petit arc en ciel vert-rouge répété à l'identique sur toutes les annonces sans aucune valeur ajoutée. Mais il faut s'approcher plus près pour lire le petit curseur noir et sa lettre blanche.


Proposition pour une meilleure visualisation

Essayons de formuler une version plus efficace de la vénérable étiquette. Le fil des idées serait le suivant

  1. effacer/atténuer l'intensité de la couleur des niveaux de l'échelle qui brouillent la lecture de loin
  2. colorer l'aiguille dans la couleur du niveau
  3. et ainsi ... utiliser l'échelle comme aiguille !!!





    Bien plus visible de loin.
    Et surgit une autre idée. Pourquoi ne pas utiliser la longueur des barres pour ajouter l'information des proportions entre niveaux ?
    Dans le cas de l'échelle des bâtiments, la représentation serait:



    Un logement de niveau G peut être plus de 10 fois plus énergivore qu'un logement de niveau A !!!!
    Sources: wikipedia

    Proposition pour un meilleur indicateur

    Le bon indicateur est conçu pour répondre directement aux questions que se pose le lecteur quand il examine les données.
    Dans le cas du logement, les questions brulantes de l'acheteur potentiel sont: «Combien coûte le chauffage annuel ?», «Sera t il possible de gagner en ajoutant de l'isolation ?»

    Pour 100 m2 si le coût est 300€/an pour un niveau A alors c'est 3000€ pour un niveau G. Sources: l'expansion
    Pour un appareil electroménager, la question clé est: «A partir de combien de temps d'utilisation, l'appareil de niveau A est-il économiquement rentable ?». Il faudrait que l'échelle indique le surcoût (ou l'économie) annuel à utiliser un appareil de chaque catégorie. Charge au consommateur de le comparer aux prix de vente.

    Conclusion

    Quel est le rapport entre les étiquettes énergie et les tableaux de bord de pilotage d'une organisation ?

    Deux transpositions directes:

    • Les échelles ne doivent pas masquer la lecture des valeurs. Face à un tableau de bord présentant de multiples indicateurs, il est bien plus facile de voir que tout est vert, plutôt que de vérifier que toutes les aiguilles noires se trouvent dans les zones vertes
    • La démarche comment répondre aux questions que se posent le lecteur est plus efficace que comment présenter au mieux les données



Un billet médiatisé

Data Publica a publié un billet qui promeut la disponibilité de données 'open' de la RATP qui jusqu'à pas longtemps pratiquait plutôt l'inverse.
Ce billet a eu une large résonance dans les médias aussi divers que: lemonde.fr, Bus & Car, Francetv.info, lefigaro.fr, DirectMatin.fr, La Tribune.fr, Liberation.fr ou SudRadio.fr. La RATP à la fois familière et secrète intéresse beaucoup.
L'exploitation des données qu'en font les médias est variable. Chacun picore les données qui lui parait faire sens: la ligne la plus longue est la 8, 14 la plus rapide, le nombre de suicides et de tentatives en diminution, le nombre de violences voyageurs a presque doublé en 6 ans, ... D'autres vont chercher des données détaillées non visualisées dans le billet initial, les connectent à des informations de contexte et en tirent des enseignements ou confirmations de convictions préexistantes.
Concevoir un tableau de bord démarre avec les buts à atteindre. Mais essayons de faire l'inverse. Partir des même données et esquisser une conception de tableau de bord à destination des voyageurs.

D'abord un point de vue

Chaque tableau de bord réussi a un point de vue. Qui est le destinataire, d'où regarde t-il ? Son intérêt, ses questions, sa connaissance préalable, son vocabulaire, ... C'est ça qui décide ce qui doit être: au premier plan, au second et à l'arrière plan. Et tant pis si certains éléments deviennent invisibles, c'est la loi de la perspective et ... une très bonne chose pour les tableaux de bord.
De cette position il faut faire la liste des objectifs et des questions intéressantes:

  • mieux connaitre le métro: où se situe(nt) ma(es) ligne(s) préférée(s) ? ponctualité, débit, ...
  • le métro est il dangereux ?
  • le métro et le RER sont ils en train de s'adapter aux handicapés ?
  • ...


Les données et leurs contextes

La donnée apporte du sens quand elle est mise en contexte: culturel, temporel, localisation, causal,... C'est elle qui permet de répondre aux questions précédentes.
Les nombres de blessés et de morts sont de parfaits exemples de données qui ne disent rien à elles seules. On peut bien sûr se rassurer en découvrant qu'en moyenne l'agression n'arrive que tous les 300.000 voyages... Mais pour en apprécier l'importance il faut les mettre en relation avec d'autres données de contexte non disponibles dans le rapport:

  • quel est le niveau normal ? Combien de blessés/décès observe t-on dans un groupe témoin durant l'équivalent d'un temps de transport ?
  • quels sont les niveaux d'autres moyens de transport ? la voiture, l'avion, ... Normalisés au kilomètre parcouru ou au temps de voyage ?
  • quelle est la répartition des causes (chute, agression, suicide, malaise, ...) ?
  • quel est le calendrier ? Observe t-on des cycles (horaire, hebdomadaire, saisonnier) ? Des corrélations avec la fréquentation, des événements particuliers, ... ?

Les informations de trafic, nombre de trains, de départs ou vitesse de pointe sont un parfait exemple inverse. Ces données ne prennent leur signification qu'agglomérées les unes aux autres:

  • à quoi sert un train à 50km/h qui ne passe que toutes les heures ?
  • le nombre de trains par ligne n'a aucun sens pour le voyageur. C'est la fréquence apparente des trains qui compte.

L'indicateur utile au voyageur c'est le temps d'attente d'un train et un prédicteur de son temps de transport.

  • le temps d'attente moyen est estimé par le nombre de départs journalier ramenés à la plage horaire de service (18 heures ?).
  • le temps de transport entre 2 stations à la vitesse commerciale maximale est un moyen simple de calibrer toutes les lignes sur une échelle unique.


... et une représentation visuelle adaptée

Les données des lignes: longueur, nombre et densité de stations sont présentées simultanément sur un diagramme à barres qui communique une vision globale de la grande variabilité des caractéristiques des lignes. Dans un tableau de bord finalisé il faudrait ajouter une visualisation/sélection des lignes sur le plan de métro.

Les détails numériques peuvent être utiles comme références, ils restent sous forme de table filtrable et triable (cliquer sur les colonnes).
Sur cette nouvelle échelle de vitesse, la ligne 14 n'est plus la plus rapide, car sa distance inter-station est la plus grande. Et la 4 n'est plus la plus lente bien au contraire.
La donnée n'est rien sans son contexte, il lui est fourni par un observateur qui fixe la hierarchie d'une perspective et ... d'autres données.
Subscribe to RSS - le bon indicateur