Visualisation de données : une introduction

Bannière pour la visualisation des données : Une amorce

VISUALISATION DE DONNÉES:

UNE INTRODUCTION

L’utilité des données n’a d’égale que la compréhension qu’on en a


Le numérique s’étend désormais à toutes les facettes de la vie. Cela a eu pour effet de décupler les données produites. Cette nouvelle réalité, combinée aux avancées technologiques, est à l’origine d’une révolution dans l’utilisation des mégadonnées. Cela n’a pourtant pas amélioré notre clairvoyance, car peu d’entre nous excellent à décortiquer des quantités massives de renseignements consignés dans des feuilles de calcul. Le volume de données à lui seul donne le vertige. Pour donner un sens à ces données et découvrir ce qu’elles recèlent, il faut plus. C’est à ce défi que tente de répondre la représentation visuelle des données.

Drapeau du Canada évoqué en chiffres

Le recours à la visualisation permet de dégager l’information que dissimule une quantité écrasante de données.

Pourquoi choisir la visualisation?


La vue permet d’acquérir plus d’information que tous les autres sens combinés 1. Seuls 10 % d’une information entendue subsiste en mémoire après trois jours. Lorsqu’on ajoute une image, ce chiffre augmente à 65 % 2.

Comparaison des traitements simultané et séquentiel au moyen d’un œil qui regarde une horloge indiquant 1 h 30 dans le premier cas, alors que dans le second il regarde les mots Une heure trente.

Acquisition de l’ensemble de l’information tout à la fois (traitement simultané) et acquisition d’un élément d’information à la fois (traitement séquentiel).

L’information peut être visualisée de plusieurs façons selon sa nature, ce qu’elle communique, le public visé et le mode de communication. Ce ne sont que quelques-uns des facteurs qui aident à définir le type de représentation visuelle le mieux adapté aux données. Dans certains cas, c’est un document infographique composé d’éléments visuels percutants qui conviendra, dans d’autres, un graphique ou une combinaison de graphiques. En d’autres occasions, la visualisation de données permettra d’explorer à fond un ensemble de données.

INFOGRAPHIE


Infographie démontrant que 75 % des forêts au Canada se situent dans la zone boréale

Source : Ressources naturelles Canada, 8 faits sur la forêt boréale du Canada, 2017. Consulté le 18-06-2018.

GRAPHIQUE


Graphique démontrant une ventilation des ressources naturelles au Canada

Black graph legend Terres déboisées : 0,03 million d’hectares

Red graph legend Forêts ravagées par les insectes : 20,3 millions d’hectares

Yellow graph legend Forêts récoltées : 0,72 million d’hectares

Orange graph legend Forêts brûlées : 3,9 millions d’hectares

Source : Ressources naturelles Canada, 2017. L’État des forêts au Canada. Rapport annuel 2016.

VISUALISATION DES DONNÉES


Graphique d’une carte du Canada permettant trois vues : Diminution du couvert forestier; Augmentation du couvert forestier; Couvert forestier total. L’image choisie est celle de l’augmentation du couvert forestier et montre les régions au Canada qui ont connu une telle augmentation. Sous la carte se trouve une échelle temporelle qui marque les décennies de 1950 à 2010. L’an 200 a été choisi.

Source : Global Forest Watch, 2014. World Resources Institute. Consulté le 18-06-2018.


1 Ware, Colin. Information Visualization. Perception for Design. San Francisco. Elsevier, 2004, p. 2. Deuxième édition.

2 Medina, John. Vision. Brain Rules

Qu’est-ce qu’on entend par visualisation des données?


L’art de représenter l’information sous forme visuelle ne date pas d’hier, mais le vocabulaire dans ce domaine continue d’évoluer. Dans ce document, nous nous intéressons à la représentation visuelle interactive des données afin d’en faciliter la compréhension. Si les visualisations varient grandement sur le plan de la complexité et de l’esthétique, elles partagent néanmoins les caractéristiques décrites ci-contre.

EXPLORABILITÉ

EXPLORABILITÉ

La capacité d’explorer de multiples variables et combinaisons, afin de mettre au jour une trame de fond et d’en dégager de l’information qui n’est pas visible à première vue.

ACCESSIBILITÉ

ACCESSIBILITÉ

Une interface pensée qui invite à la découverte et se limite à l’essentiel.

INTERACTIVITÉ

INTERACTIVITÉ

Un outil qui permet d’explorer les données, d’en tirer des conclusions ainsi que d’en dégager des corrélations.

La création d’une visualisation


Une équipe multidisciplinaire est la clé. L’équipe idéale réunit concepteurs, spécialistes de la visualisation de données, programmeurs, experts et coordonnateurs. Voici un aperçu de ce processus.

Point d’interrogation – Pour réfléchir aux questions qu’on veut poser.

1. Définir le sujet

Choisir le contenu

La première étape consiste à déterminer le sujet et à réfléchir aux questions qu’on veut poser.

Tableau de données – Pour bien cerner les données.

2. Cibler les données

Sélectionner, préparer, organiser, comprendre

Il s’agit d’une étape très importante; il faut prévoir le temps nécessaire à la découverte et à la structuration des données. Mieux les données sont comprises et organisées, plus facile sera la suite du processus. Des données bien structurées sont essentielles pour la visualisation!

Graphique linéaire – Pour décider du modèle visuel de base, esquisser des idées, puis établir la correspondance

3. Concevoir et créer

Décider du modèle visuel de base, esquisser des idées, établir la correspondance entre données et éléments visuels et programmer

À cette étape, on peut décider d’utiliser un modèle visuel de base en guise de référence (graphique à barres ou linéaire, histogramme). Il faut ensuite faire correspondre les données aux éléments visuels : position, taille, couleur, teinte, orientation, transparence et forme. Viennent ensuite le graphisme de la page même et le peaufinage axé sur la clarté. Puis, on procède à la programmation à partir des schémas pour donner vie au tout et aux fonctions interactives.

Tablette à pince – Pour évaluer les résultats, en vérifier l’exactitude et raffiner le tout.

4. Tester et mettre au point

Vérifier l’exactitude, le fonctionnement, l’adaptabilité

Il s’agit d’un processus grandement itératif, particulièrement une fois la composante interactivité ajoutée. C’est à ce moment qu’on voit si les résultats sont ceux escomptés, ou s’il faut retoucher les couleurs ou corriger des erreurs. Cela demande du temps, une collaboration très étroite et beaucoup de communication.

Carte montrant des points reliés entre eux – Pour publier les données, en assurer l’accessibilité et les partager.

5. Publier

Assurer l’accessibilité, partager et distribuer

Toute adaptation, s’il y a lieu, sera dictée par l’environnement Web où résideront les visualisations. Certains sites Web sont assortis d’exigences relatives à l’accessibilité ou offerts en plusieurs langues. Peuvent aussi s’ajouter des liens vers des réseaux sociaux, des téléchargements de données et d’images, et d’autres éléments explicatifs.

Loupe au-dessus d’un graphique – Pour obtenir de la rétroaction à des fins de vérification et de révision.

6. Analyser et réviser

Rétroaction / Essai des modèles des utilisateurs/ Modification

Une fois la visualisation en ligne, il est primordial de solliciter les commentaires et d’analyser l’utilisation qui est faite des données. La rétroaction guidera les travaux futurs.

La visualisation de données à l’Office national de l’énergie


Pour les visualisations personnalisées, l’Office travaille avec le laboratoire Interactions à l’Université de Calgary et des entreprises en démarrage. Le code source pour toutes les visualisations personnalisées et les données qui l’alimentent sont accessibles en application de la Directive sur le gouvernement ouvert.