GoogleForms

Convertir un sondage Google Forms en rapport visuel automatique

Vous avez publié un formulaire Google Forms et avez des réponses que vous voulez analyser et présenter en 3 étapes faciles.

1- Convertir les réponses du sondage en Google sheets

Au sommet de la page se trouve deux onglets: QUESTIONS et RESPONSES. Quand ce deuxième est sélectionné apparaît une petite croix blanche sur fond vert. C'est l'appui sur ce bouton qui provoque la conversion et l'ouverture du classeur.

conversion en Google sheet

2- Publier le Google Sheet sur le web

Le menu Files/Publish to the web ... fait apparaître la fenêtre de réglages suivante:

publication sur le web-1

Il suffit de vérifier que les options sont correctement positionnées et de cliquer Publish.

publication sur le web-2

L'adresse de partage se trouve dans le champs au centre prête à être copiée. C'est elle qu'il faut déposer dans le champs suivant pour obtenir en échange l'adresse du rapport visuel.

3- Consulter le rapport automatique

Coller le lien ici:

Vous pouvez consulter votre rapport automatique là:

lien invalide

Il se mettra automatiquement à jour en fonction des nouvelles réponses.
Si vous voulez vous faire une idée avant d'essayer, voici quelques exemples déjà traités:


Les assiettes volantes

Vous connaissez certainement ce numéro de cirque qui s'appelle les assiettes volantes ? Il s'agit de faire tourner sur des tiges flexibles des assiettes, le plus possible et sans qu'aucune ne tombe. On se prend à partager l'envie d'en rajouter encore et encore, conjugué avec une crainte grandissante de voir une assiette tomber. Le stress grandit avec le nombre d'assiettes en vol. Le numéro devient rapidement jubilatoire: une course effrénée entre les nouvelles assiettes à mettre en mouvement et celles qui oscillent dangereusement vers la chute. On hésite entre vouloir le succès de la tentative et l'envie d'entendre des assiettes se briser, car on sent bien que l'artiste sur-joue l'urgence et la panique.


image

Beaucoup de chefs d'entreprise que je rencontre me disent avoir l'impression de faire ce numéro tous les jours et 24/24. Les assiettes étant n'importe quel sujet critique: la trésorerie, les stocks, les ventes, un impayé, la démission soudaine d'un collaborateur, ou un message du banquier sur le répondeur.

Levez la main ceux qui voit leur travail comme une succession de sprints vers la prochaine assiette qui va tomber.

Les indicateurs stratégiques

perceptible.fr aide le chef d'entreprise à identifier ses indicateurs stratégiques. Ceux qui permettent de projeter l'activité et de décider concrètement ce qui est le plus urgent à faire aujourd'hui pour préparer demain.

Pour le marchand de glace, par exemple, ce sont la météo à 4 jours et les prix de ses concurrents dans un rayon de 500 m.

La représentation visuelle

Les chiffres sont utiles comme référence, mais ils peuvent aussi être un obstacle à la compréhension et à l'action. Le tableau de chiffres qui tient à jour en temps réel les coordonnées et vitesses angulaires des assiettes décrit complètement la situation mais n'est d'aucune utilité immédiate à la décision.

Il faut plutôt un plan avec des minuteurs graphiques à la position de chaque assiette qui affichent le temps restant avant la chute.

Tableau de bord à partir des bilans successifs

Les indicateurs stratégiques sont des choses très personnelles uniques à chaque entreprise. Il existe néanmoins un niveau commun à toutes les entreprises: la finance.

perceptible.fr offre un service de Diagnostic PME qui permet à partir de 3 à 5 bilans de visualiser les engrenages financiers qui transforment les commandes gagnées en: achat de matières premières, marge, valeur ajoutée, salaires, impôts et finalement rentabilité des capitaux propres. L'ambition est d'abord d'expliquer les pourquoi de la trajectoire, .... puis de prédire et d'ajuster.

Elles sont mises à la queue leu leu sur plusieurs exercices pour faire apparaître les trajectoires des éléments clés. Ceux qui répondent aux questions importantes:

  • Où se joue la rentabilité de l'entreprise ?,
  • Cette baisse (résultat, valeur ajoutée, marge brute, ...) est elle le reflet de la diminution des commandes ou d'une moindre performance interne ?,
  • Où se trouve le goulet d'étranglement ?,
  • ...

C'est la mise en lumière des indicateurs comparables: Production par personne, part de la sous-traitance ou des moyens techniques, Valeur Ajoutée/ Production, ... qui permettent de comprendre les causes et leurs enchainements jusqu'au bénéfice ou la perte de l'exercice en cours. Ces mêmes indicateurs sont aussi les bras de levier permettant d'agir sur le futur: imaginer, simuler et décider les changements pour atteindre l'objectif.

Diagnostic PME

perceptible.fr propose un service de diagnostic PME non intrusif qui, à partir de 1 à 3 liasses fiscales de l'entreprise, fournit un rapport visuel de l'évolution des paramètres clés.
Pour tout renseignement: alain.roan@perceptible.fr


Comprendre les finances de l'entreprise


Chiffre d'Affaires à l’extérieur, Production à l'intérieur

Les notions de Chiffre d'Affaires, Production, Ventes ou Facturation sont utilisées comme quasi synonymes par beaucoup.

Le Chiffre d'Affaires: quantifie l'aptitude globale de l'organisation à vendre et à livrer. Mais sans distinction entre une sortie du stock de l'an dernier ou d'une fabrication à la demande. C'est un bon indicateur de la capacité commerciale globale de l'entreprise vue comme une boîte noire et de sa présence sur les différents marchés.

Mais si on essaye de comprendre ce qui s'y passe ou l'origine de sa rentabilité il faut ouvrir la boîte et utiliser l'indicateur le plus commensurable avec les charges de l'entreprise (frais de personnel, achat de matières premières, ...).

La Production: tout ce qui a été produit par l'entreprise, avec son personnel, ses outils, sans considération de vente, facturation ou variation de stock.

La Production est la grandeur qui porte le mieux l'activité interne de l'entreprise.

Un exemple concret

Prenons l'entreprise Acme SARL au hasard et examinons sur plusieurs exercices consécutifs l'évolution de son bilan. Pas tout le bilan dans un premier temps, seulement deux de ses plus importantes grandeurs financières (en chiffres):



ou en courbes:


Entre le début et la fin, la Production augmente de 50% pendant que le Résultat lui fait +80%. Tout va bien! Les plus téméraires, souvent les moins forts en calcul, osent parfois même:
    On a gagné 30 points de productivité !!...

Est ce si sûr ?

La question intéressante qui permet de distinguer entre la variation de volume d'activité et la variation de performance c'est: quelle PROPORTION de Production est transformée en Résultat ? C'est l'indicateur comparable.



La performance AUGMENTE de 2 points, et pas de 30% !!

L'indicateur utile est COMPARABLE

Les indicateurs utiles, ceux qui éclairent la machine et son fonctionnement, partagent une caractéristique:


    COMPARABLE DANS L'ESPACE ET DANS LE TEMPS


L'espace: entre magasins, clients, entre filiales, procédés de commercialisation, ou avec les concurrents, ...
Le temps: se comparer à soi même, au trimestre précédent, à l'an dernier ou au plan de l'année prochaine.

C'est plus facile quand l'indicateur est sans dimension: un pourcentage, un ratio ou si la dimension est à hauteur d'homme indépendante du volume: k€ par personne, par m2, ...


PAS COMPARABLE MIEUX
CA CA/Personne
Besoin de Trésorerie Besoin de Trésorerie en j de CA
Valeur Ajoutée Valeur Ajoutée/Production
Résultat net Rentabilité nette
Dette Financière Dette/Capital Économique
... ...



Mais la question suivante est POURQUOI vient cette augmentation ?

L'indicateur utile EXPLIQUE ses variations

Il faut ouvrir la boîte qui transforme Production en Résultat pour faire apparaître deux des étapes fondamentales qui s'y trouvent:

  1. Création de la Valeur Ajoutée: ce qui reste après avoir acheté ce qui est nécessaire pour réaliser la Production (matières premières, sous-traitance, frais de commercialisation, ...).
  2. Utilisation de la Valeur Ajoutée: pour rémunérer les moyens de production (personnel, entretien de l'outillage, provisions pour risques, ...)





Et ce qui reste c'est le Résultat, positif ... ou négatif qui servira à enrichir l'entreprise, payer les impôts et à verser des dividendes aux actionnaires.

Mais où se trouve la performance ? Où est l'augmentation de 2 points ? Quelle ligne, quelle colonne ?
Introuvable dans les chiffres en € qui mélangent les variations de volume d'activité et les évolutions de performance.
La réponse est dans les indicateurs exprimés en pourcentage:


La part des Achats dans la Production a baissé de 50% à 25%. Et dans le même intervalle la rémunération des moyens est passée de 80% de la Valeur Ajoutée à 84%.
Les 2% proviennent de la combinaison de ces deux mouvements: 75% x 16% = 12%.

Il est possible de deviner l'histoire en examinant l'évolution de l'outil de production constitué du nombre de personnes et les investissements en outils/moyens de production et de calculer les ratios comparables ramenés par personne.


La Production/Pers est quasi stable mais la Valeur Ajoutée/Pers fait plus que doubler. La diminution des achats de matières premières et de sous-traitance est la cause de cette augmentation. L'entreprise s'est réorganisée pour en faire plus par elle-même au prix de moyens plus chers (outillage, personnel spécialisés, ...) pour un bilan global +2% sur son Résultat.

Le 'making of' des chantiers


Historique

Mon implication dans les chantiers de la ville de Toulouse à commencée lors du Hackaton. Elle s'est continuée naturellement dans le concours Défi Numérique. L'équipe a produit une web-app et une app Android: Info'Travaux qui inclut les idées de visualisation décrites ici et y ajoute des fonctionnalités précieuses comme l'abonnement aux nouveaux chantiers dans les zones d'intérêt et surtout les itinéraires en voiture permettant d'éviter les chantiers. Le projet Info'Travaux a gagné le prix du "Services aux citoyens".





Google Maps et autres Waze peuvent parfois constater un ralentissement dans une rue, mais ni l'un ni l'autre ne sait pourquoi et pour combien de temps, Info'Travaux lui oui.

A la recherche de la visualisation efficace

Quand on essaye de placer sur une carte des centaines de punaises et parfois des dizaines sur 1 cm2, on se rend compte qu'il y a sûrement mieux à faire que de superposer des icônes/marqueurs identiques qui seront illisibles et très difficiles à sélectionner individuellement.

Il y a maintenant plus de 30 ans qu' Edward Tufte a proposé un critère objectif de la bonne utilisation de l'encre: le data/ink ratio. En français et sur écran: le rapport nb données/nb de pixels. Chaque trait, couleur, surface utilisé doit être questionnée à propos de son apport à la présentation des données en regard de la place qu'elle accapare au détriment des autres sur le papier, l'écran et ultimement sur la rétine et dans le cerveau de l'utilisateur. C'est un tamis très efficace pour apprendre à éliminer le bruit visuel et se concentrer sur l'essentiel.

Encore mieux, s'il est possible de pondérer chaque donnée par la valeur qu'elle a pour l'utilisateur: (valeur X donnée) / pixels, on peut créer des interfaces et des visualisations optimales pour les familles d'utilisateurs qui partagent les mêmes objectifs.

La mission que l'on assigne au marqueur est alors d'attirer l'attention du lecteur d'autant plus que le chantier est important pour lui. Un premier essai inspiré de visualisation utilisait la durée restante. Un cercle de diamètre d'autant plus gros que le chantier allait encore longtemps perturber la circulation. Une fois réalisé et expérimenté plusieurs défauts se font jour et notamment deux:

  1. la taille des cercles devient très grande à cause de la forte dynamique des données (de 1j à 3 ans) jusqu'à devenir inutilisable
  2. le critère durée est trop écrasant, une gène énorme courte est totalement masquée par des gènes très légères ou nulles pour certain modes de transport pour peu qu'elles soient longues.

Cette deuxième version va plus loin en faisant émerger des données le niveau de gène par mode de transport grâce à une pondération des différents impacts sur la circulation:



On peut combiner les deux dimensions :
  • le niveau de gène sur une échelle de 0 à 5
  • la durée restante mais bornée à 3 mois pour éviter le défaut de la forte dynamique

en un seul indicateur, selon les principes suivants:

  • la taille du disque est d'autant plus grande que le chantier est gênant, avec une légende de couleur en redondance
  • l'épaisseur de la couronne représente la durée restante. Disque plein si encore plus de 3 mois et un simple cercle pour la semaine.



Ainsi combinés, le nombre de pixels occupés sur l'écran est d'autant plus grand que le chantier mérite l'attention du lecteur.Quelques bonnes propriétés de cet indicateur:
  • les chantiers proches se superposent pour former une grande tâche de couleur qui indique tout naturellement et sans plus de détails un quartier fortement perturbé et pour un temps certain
  • en zoom large les grosses tâches masquent les petites mais se séparent quand l'agrandissement est suffisant
  • le caractère quasi aléatoire de la position, taille et épaisseur fait que les marqueurs se distinguent et se sélectionnent facilement


Mode d'emploi

Chaque marqueur est un chantier.

  • Détails: Clic permet de faire apparaître une bulle d'information à propos du chantier. Maj clic permet d'en ouvrir plusieurs à la suite.
  • Navigation spatiale: le curseur en forme de main permet de faire glisser la carte par appuyer-glisser. Clic-clic fait un zoom avant, maj clic-clic un zoom arrière. Tracer un rectangle avec maj-appuyer-déplacer-relâcher zoom sur cette zone. Et bien sûr les icônes + et - en haut à gauche permettent le zoom avant/arrière
  • Filtre: les icônes voiture, piéton, vélo permettent de ne considérer que les chantiers qui impactent un mode de transport en particulier. Le i rassemble tous les chantiers y compris ceux sans influence sur la circulation
  • Voyage dans le temps: la glissière en bas de la carte permet de faire apparaître la situation à une date antérieure ou de se projeter dans le futur pour voir ce que seront les chantiers dans 3 mois.

A lire dans Chrome, Firefox ou Safari Ouvrir dans une fenêtre séparée

Les Données Ouvertes

C'est à l'initiative de la Communauté Urbaine de Toulouse Métropole que les données concernant les chantiers sont rassemblées à l'intérieur d'une application. Chaque jour une partie des données gérées sont exportées vers la zone Open Data où elles deviennent accessibles à tout un chacun qui peut la télécharger en divers formats.

Améliorer les données et leur mise à jour

La mise à disposition des données est un bénéfice incontestable. Et on en veut immédiatement plus. Au jour d'écriture de ce billet (oct 2014), on aimerait bien quelques suppléments:
  • Un prévisionnel serait précieux: les chantiers sont publiés le jour de leur démarrage prévu. Dommage pour les chantiers qui durent une journée! Disposer d'un prévisionnel pour les chantiers, même s'il est amené à changer, pourrait être très précieux. Est ce possible ?
  • Quelques anomalies: certains jours le fichier n'est pas disponible au téléchargement . Ou identique à celui de la veille. Ou est un fichier valide mais les données qu'il contient sont incomplètes (des chantiers publiés la veille ne sont plus là mais sont à nouveau présent dans le fichier du lendemain). L'exploitation des données ouvertes doit trouver des solutions pour tolérer ces aléas.
  • Pas de mise à jour en cours de route: certainement que des modifications ont lieu après la publication des données (chantier annulé ou terminé avant la date prévue, ...). On ne constate pourtant aucune mise à jour dans l'open data. Les paramètres d'un chantier publié restent identiques d'un jour à l'autre jusqu'à ce que le chantier disparaisse de la liste. Pourquoi ?
  • Pourraient être plus précises: l'impact du chantier est pour le moment très grossier: un point GPS, un nom de rue et parfois une fourchette de numéros dans la rue. S'il était possible de récupérer les plans d'emprise alors les trajets d'évitement serait plus précis y compris pour le piéton et la personne à mobilité réduite.

Les données cachées dans les données

Comme très souvent, les données sont instructives pas seulement par leur valeur et leur évolution mais aussi par leur présence (les dates de mises à jour) ou à leur disparition soudaine. Et les chantiers n'échappent pas à la règle. Certains sont très sages, le chantier est répété à l'identique tous les jours entre les dates de début/fin prévues initialement. Tandis que d'autres:
  • apparaissent plus tard que la date de début déclarée
  • disparaissent plus tôt que la date de fin définie
Peut être que les données exportées représentent en fait le permis de mener un chantier qui encadre le déroulement pour éviter de mélanger dans une même tranchée et au même moment des interventions sur l'eau, le gaz et l'électricité... Il serait alors logique qu'aucune mise à jour rétroactive ne soit effectuée. Mais le citoyen préférerait certainement des informations plus proches de la réalité de la rue. Sont elles disponibles ?

Le Tableau de courbes plutôt que le Tableau de chiffres

La Table de Valeurs

La version la plus élémentaire de la présentation de donnés est le catalogue de valeurs. L'ambition est de fournir de manière rapide la réponse aux questions les plus élémentaires: Quel est le montant des ventes en France en Avril ?
La table est organisée pour fournir avec toutes les décimales, au centime près, toutes les réponses selon un format très touffu qui décourage la moindre tentative de dégager visuellement des informations de tendance et de comparaison.




Il s'agit ici plus d'un reporting à plat qu'un outil d'aide à la décision. Elle ne devrait plus être présentée à des humains au 21 siècle.

Le Tableau digeste

Une version plus humaine consiste à présenter les nombres sous une forme privilégiant l'ordre de grandeur à la précision. Deux chiffres significatifs sont largement suffisants pour discriminer de 1 à 100. L'utilisation d'unités adaptées permet de limiter le nombre de zéros et renforce l'appréciation visuelle des différences. Il est même possible de d’omettre les valeurs les plus faibles.



Le Tableau de Courbes

Mais si l'objectif est de comprendre, piloter, réagir, maximiser les ventes, alors il est souhaitable de passer à d'autres types de représentations. L’œil est très efficace pour reconnaître des schémas, surveiller les tendances, prolonger visuellement une trajectoire, détecter les points aberrants,... Utilisons le au maximum en prenant le point de vue extrême opposé aux versions précédentes, un tableau sans aucun chiffre.



Les courbes visualisent l'historique des grandeurs au cours de l'année. La zone grisée en arrière plan indique le cumulé à date. La France est la première source de revenu, suivi de l'Europe en baisse et des US en croissance. Les ordres de grandeur deviennent visibles et l'efficacité de la publicité sur le chiffre d'affaires apparaît en pleine lumière. Il n'est même plus utile de connaître l'unité de l'axe vertical k€, M€ ou $, aucune importance.
Soudain le lecteur se met à poser des question plus intelligentes: Pourquoi la publicité sur la zone Asie est-elle si peu efficace ? Que se passe t-il en zone Europe ? L’accroissement relatif de publicité est il une réaction aux mauvais résultats ou l'effet mécanique de la baisse de CA ?


Infos'travaux


Hack The City

Fin mai, un événement Hack The City était organisé au sein de la Mélée Numérique. Expérience très intéressante et énergisante. Une dizaine de projets autour de la ville ont travaillés pendant un Hackaton de 36 heures: concept, business model, plan de financement, prototypage, ...
Le moniteur.fr décrit l'évènement en détails.
Le jury a récompensé 4 projets.

Le projet Infos'travaux

J'ai participé à l'équipe Infos'travaux qui a défini et prototypé une application mobile et web permettant aux riverains et aux usagers de la ville de tout savoir sur les chantiers de la ville:

  • nature du chantier, durée prévue, ...
  • itinéraires bis: voiture, piéton, PMR, livraison, ...
  • prévisions de chantiers, de nuisances, ...
  • abonnement aux flux d'informations d'un chantier ou d'une zone

Ce projet est arrivé 2ieme.

Tableau de bord des Chantiers

Les données ouvertes de la ville de Toulouse sur les chantiers, et l'application Tableau Software Public permettent de construire simplement un tableau réactif qui aide à mieux comprendre que sont les chantiers de l'agglomération. Version pour ordinateur de bureau.


Il y a d'abord des données statiques:
  • nombre des chantiers
  • répartitions
  • carte avec la position des chantiers
Puis des bulles qui apparaissent quand le curseur survole un des cercles sur la carte et qui fournit:
  • la nature des travaux
  • l'impact sur la circulation
  • les dates de début et de fin
Et enfin une capacité d'interaction qui permet par le jeu des filtres Nature, Durée ou Entreprise, de poser des questions qui combinent plusieurs dimensions:
  • Où se situent les chantiers de Voirie ?
  • Combien de chantiers de Telecom de la société X sont ils en cours ?
  • Quels sont les chantiers qui durent le plus longtemps ?
  • ...
Quelques points saillants:
  • il n'y a pas de camembert pour représenter la répartition par catégories mais des barres horizontales triées
  • le filtre s'effectue par sélection directe sur la donnée
  • l'appel à Google Map à partir des coordonnées GPS

Peut on distinguer un écart dû au hasard d'une sur ou sous-performance ?

C'est une question récurrente quand on parle de série chronologique de valeurs issue d'un processus (ventes, défauts, visites, abonnements, temps de livraison, ...) :
Tous les tableaux de bord affichent des séries de données. Tous les managers se saisissent de la valeur la plus récente et la compare à:

  • la valeur précédente
  • la valeur de l'an dernier à la même époque
  • l'objectif
  • l'avance/retard sur le cumulé à date
  • ....

Positif ? Négatif ? En pourcentage ?
Et là les ennuis commencent !! Faut il interpréter cet écart comme une variation de performance ou un simple bruit résultat de conjonction d'événements hors de tout contrôle et somme toute normal ?


Une variation n'est pas forcement un signal
et plus insidieux
Une stagnation est peut être un signal

Beaucoup d'indicateurs utilisent les flèches haut/bas qui disent la variation avec la valeur précédente. C'est malheureusement une fausse bonne idée quand on l'applique sur une série chronologique soumise à des variations aléatoires.
Combien de réunions de crise ou de célébrations ont été organisées sur la base de simples écarts à la moyenne ? Et à l'inverse combien auraient dues être organisées si une variation aléatoire n'avait pas masquée une tendance lourde à laquelle il aurait fallu réagir immédiatement ?

Le Process Behavior Chart

Inventé par Walter A. Shewhart en 1924 ce diagramme fait partie du domaine du Statistiscal Process Control. Repris par Deming, il est exploité dans beaucoup de démarches qualité (6 sigma).
D'une simplicité désarmante, très robuste et d'une large applicabilité, cette technique prend la forme d'un graphe double qui rend visible les caractéristiques du processus. Il peut s'utiliser au fil de l'eau ou à posteriori. Cette approche, pas très jeune, est modeste dans ses ambitions. Il n'y a pas volonté de prévoir ou d'expliquer, seulement d'observer, de constater et de s'ajuster. Regardons ce qu'il est possible d'en tirer. Le plus simple n'est il pas le meilleur ? Ou au moins à essayer en premier ?

La détection des valeurs anormales

Le signal est tracé sur sa moyenne (en pointillé) et est entouré d'une zone de variation "normale" (en bleu clair). Si un point en sort, il est dit "aberrant" (en rouge), un accident, un évènement exceptionnel, ... ou le signe précurseur d'un changement dans le processus de production des données ?

C'est là que le management peut lancer à juste titre une réunion d'analyse des causes.
La largeur de la zone bleue est calculée à partir du signal lui même, elle est proportionnelle à la moyenne des variations d'une valeur à la suivante.

La détection de changements des caractéristiques du processus

Le diagramme permet de voir que le signal est en train de diverger de son gabarit calculé. Il propose un critère précis: l'apparition de 8 points successifs du même coté de la moyenne (en orange) indique que le signal a changé de mode et qu'il faut recalculer la moyenne et la zone de variation pour pouvoir continuer à l'interpréter correctement.

Le diagramme se transforme en une succession de moyennes et de zones admissibles qui donne un recul très informatif sur les données de base. L'œil se décolle de la courbe des valeurs individuelles et découvre le paysage global. Les bonnes questions surgissent: Pourquoi le signal a t il changé de nature à ce moment ? Est ce corrélé à un autre changement ? Pourquoi autant de hausse ? de baisse ?


Le diagramme complet

Le Process Behavior Chart est en réalité double: Le signal comme vu précédemment et en dessous le diagramme de la suite des sauts entre valeurs successives.

Le même procédé (moyenne, zone de variation, ...) s'applique à ce diagramme des variations et pour être complet, les valeurs aberrantes et les changements du processus, doivent se lire sur les deux diagrammes simultanément. Une valeur est aberrante si sa valeur s'écarte trop de la moyenne OU si la différence avec la valeur précédente est anormale. C'est aussi valable pour la détection d'un changement de mode à faire sur l'un OU l'autre des diagrammes. Sur l'exemple, le signal oscille autour de la moyenne, il ne déclenche pas la couleur orange. Par contre la diminution de l'amplitude de ses variations déclenche le critère des 8 points consécutifs sous la moyenne dans le diagramme du bas.
Après 10 minutes de formation, un néophyte complet est capable de lire et de raisonner sur un Process Behavior Chart.

Une référence lisible sans aucun bagage statistique que je recommande: Wheeler, Donald J. (2000). Understanding Variation: the key to managing chaos.


Diagramme en toile d'araignée

Toile d'araignée, radar, polaire ou Kiviat, il a beaucoup de noms.
Je remarque que ce diagramme exerce un pouvoir d'attraction très significatif. Beaucoup de personnes avec qui je discute (clients, stagiaires ou simples contacts) regardent ce diagramme avec beaucoup d'envie et de respect. Et quand vient le moment où l'on me demande mon avis, je suis embarrassé pour faire une réponse courte.



Bonne Année 2014


Sa forme circulaire, sa fonction naturelle

Sa forme en cercle se prête naturellement à la représentation de données qui après avoir fait un tour complet reviennent ... à leur point de départ.
Deux cas évidents d'application:

  • l'espace: sources sonores, champs visuel, direction du vent, ...
  • le temps et ses cycles: les heures de la journée, les jours de la semaine, les mois de l'année.


Sa capacité à visualiser plusieurs axes simultanément

Mais la plupart des utilisations de ce diagramme que l'on rencontre dans la nature exploitent des axes de catégories qui n'ont aucun ordre intrinsèque.



Le fait d'être côte à côte pour deux axes est totalement arbitraire. Voici 4 versions du même jeu de données.





L'ambiguïté surface/ distance

La rose de Florence Nightingale montre l'origine des décès des soldats lors de la guerre de Crimée de 1854. La surface rouge les blessures, bleue une maladie contagieuse et noire non classée. On comprend bien à la vue de ce diagramme que les ennemis les plus féroces sont le typhus et le choléra.



Ce n'est pas évident au premier coup d'œil mais il y a deux manières distinctes de lire le diagramme de Nigthtingale:

  • la distance du périmètre externe de la tranche au centre
  • la surface de la tranche (ou de la portion de tranche)

Et ce n'est pas la même chose ! Quand le rayon de la tranche est multiplié par 2, la surface de celle ci est multipliée par 4. La vaste majorité des cobayes à qui on demande de retrouver les valeurs des données à partir du diagramme de Nightingale, mesurent les rayons alors que ce sont les surfaces qui encodent les données.
Y compris pour les représentations filaires pour lesquelles il semble clair que c'est la distance au centre qui est la donnée, on ne peut s'empêcher de voir la surface que forme l'angle avec la ligne qui joint les points de mesure successifs. Surface de forme aussi arbitraire que l'ordre choisi pour les axes!!!

La comparaison sur plusieurs axes


Un diagramme pour tous

A condition d'utiliser une représentation filaire (pas comme celle de Nightingale), il est possible de mettre plusieurs entités sur un même diagramme et de les comparer. A un objectif ou entre elles.

La convention habituelle est que le centre est la note la plus faible, la périphérie la plus haute.





Les concurrent les plus directs du diagramme araignée

  • le diagramme en points - (à droite c'est mieux)






  • la carte de score ou la punch card - (noir c'est mieux)






Un diagramme pour chacun

C'est l'utilisation faite par une célèbre marque de comparatifs de produits techniques.



Le diagramme radar a des atouts certains dans cet usage. Le regard peut identifier et reconnaitre efficacement des profils. Les grands nez, les petites oreilles, ... Enfin l'ensemble des caractéristiques désirables ou indésirables parmi un grand nombre de schémas.
L'appareil Sony fournit un bon exemple de l'erreur de perception surface/distance. Sur la version radar l'appareil est quasiment parfait. Le diagramme en points (dotplot) montre de manière plus objective ses caractéristiques.


La facture de téléphone des adolescents (2)


De nouvelles questions... et les réponses

Le précédent billet décrit l'analyse des données journalières et horaires d'envois de SMS.


Malgré le fait que toutes les données sont sur la table, certaines questions utiles n'ont pas de réponses directes. La première tout à fait dans le prolongement des données présentées: « Quel est le volume global par mois ? Augmente t-il ? Baisse t-il ? »

Cette question tout à fait valide peut être répondue élégamment en enrichissant l'indicateur visuel pour superposer la journée et le mois qui devient une zone ombrée en arrière plan.
Au passage, la codification (bleu=semaine, gris=week-end) se transforme en (bleu=yaécoledemain, gris=grassematpossible) bien plus efficace pour l'analyse et ... la décision.

De nouvelles représentations interactives

Mais d'autres questions restent inaccessibles à ce mode de visualisation. Par exemple:
  • Les envois de SMS après 23 heures les jours de semaine ont ils baissés depuis la rentrée scolaire ?
  • Y a t il beaucoup d'émissions de SMS durant les heures de cours ?
  • Quel est le jour de la semaine d'émission du plus grand nombre de SMS ?
  • ...
D'où l'idée d'un tableau de bord plus dédié qui utilise html5 (Visible qu'avec un navigateur récent: firefox, chrome, safari, internet explorer>=9, .... ). En jouant sur la sélection des données sur les trois panneaux, il est possible de répondre aux trois questions précédentes. Saurez vous le faire ?

Voir la sécurité



Deux échelles de temps

La sécurité a deux dimensions temporelles:

  • l'année, le semestre, le trimestre: la planification réalisée pour mettre en place la stratégie de sécurité (les mesures concrètes à appliquer, les moyens à utiliser) déduite de l'analyse des risques (ce qu'il faut protéger, contre quoi, à quel prix)
  • le temps réel, la journée, la semaine: la veille en continue qui permet de:
    1. vérifier que les mesures décidées sont correctement mises en œuvre
    2. piloter l'exécution des contre-mesures appropriées pour parer les attaques d'une part et pour colmater les failles qui apparaissent d'autre part


La veille

Intéressons nous aux vulnérabilités. Techniquement la surveillance est assurée par un scanner qui teste de manière périodique chaque machine du réseau vis à vis d'une liste de vulnérabilités connues: applications installées sans les derniers correctifs de sécurité, ports ouverts sans raison, mot de passe par défaut, ...

La question périodique est: A t-on détecté des vulnérabilités dangereuses ?
Oui -> enclencher au plus vite une correction adéquate. Non -> passer à autre chose...
- « Non ?...»
- « Non, ...enfin, pas depuis la dernière fois que l'on a vérifié... »
Et là bien sûr, une foule d'autres questions et ... de jurons surgissent...
Le plus souvent une donnée n'est pas connue à tout instant mais fait l'objet d'une ronde régulière. Et il arrive que des machines ne soient pas accessibles ou éteintes au moment de l'essai de vérification. Le dispositif de surveillance peut aussi être en panne. En pratique, il faut savoir se contenter de la dernière valeur observée et de l'âge de l'observation. Cet âge devient une donnée à part entière utile pour 1) juger de la fraicheur de l'information et 2) déclencher lui même des alarmes.

Echelle des alarmes

Les deux dimensions (intensité et âge/confiance) se combinent sur une échelle unique de gravité progressive. Que la dernière vérification d'une machine date de 15 jours est fâcheux (orange), mais il est certainement plus grave de constater qu'une correction de vulnérabilité n'est toujours pas effectuée après le délai prévu (noir).


Les niveaux sont précisément définis par les seuils de vulnérabilité et les délais de réaction que fixe la politique de sécurité.

L'alarme et son contexte

Une alarme attire l'attention et invite à la décision rapide, elle doit donc aussi fournir suffisamment de contexte pour prendre la bonne décision.
En complément de l'alarme figurée par son code couleur, l'historique permet de répondre aux questions sur son évolution récente:

  • « depuis combien de temps cette alarme est elle enclenchée ? »
  • « la situation est elle en train de s'améliorer ou d'empirer ? »
  • ...

Disposer les machines les unes sous les autres permet de distinguer des schémas se produisant simultanément sur plusieurs machines:

  • « est ce un cas isolé, ou la manifestation d'un phénomène plus large ? »
  • ...


Comment lire l'indicateur:
  • la première colonne synthétise l'état de l'indicateur à la date du jour (15/5) pour chaque machine
  • deux machines ont des vulnérabilités non tolérables, et pour celle en noir, il y a du retard de correction
  • l'historique dans la partie droite synthétise l'évolution sur les 4 dernières semaines
  • les quatre barres noires successives à droite de la Bureautique comptabilité Lyon indique qu'une correction aurait due être effectuée il y a déjà quatre jours
  • le schéma est la signature que la vérification n'a pas pu s'effectuer correctement pendant plusieurs jours consécutifs, on passe de blanc à gris, puis à orange après 3 jours. Le fait que le schéma se répète sur plusieurs lignes à la même date indique qu'il s'agit probablement d'un problème technique du côté du dispositif de scan.


L'œil décode sans effort la situation

Les bénéfices de la visualisation sont:

  • ne sont présentées que les informations qui sollicitent une réaction. Si tout va bien, tout est blanc.
  • le code couleur (gris, orange, rouge, noir), en redondance avec la taille des barres induisent un sens de la gravité évident même en l'absence de la légende exacte
  • les contextes temporel (évolution récente) et de voisinage (les autres machines) fournissent une grille de décodage très riche

Le responsable (y compris non technique) peut sans effort obtenir des réponses aux deux questions importantes concernant les vulnérabilités:

  • Surveille t-on suffisamment les vulnérabilités du parc de machine ?
  • Corrige t-on en temps utile les vulnérabilités détectées ?

Ainsi que les preuves factuelles de ces réponses.

Pages

Subscribe to RSS - alain's blog