Les 10 RaccourSci pour visualiser efficacement ses données

La visualisation de données consiste à représenter des informations sous forme visuelle, dans le but de communiquer un message précis. Elle joue un rôle de premier plan dans tout projet, puisque c’est un langage universel permettant de faire le pont entre différents intervenant-e-s. Découvrez en 10 points comment réaliser une visualisation efficace de vos données.

  1. Connaître son jeu de données - le "quoi"

    Avant de visualiser ses données, il est important de les comprendre. En d’autres mots, vous devez identifier les caractéristiques de votre jeu de données (attributs, items, ordre de grandeur, distribution etc.), afin que vous puissiez considérer une mise en forme, un design en particulier. S’il s’agit de données géolocalisées par exemple, une représentation sous forme de carte pourrait être plus adaptée.

  2. Définir son message et son auditoire - le "pourquoi"

    Une fois les caractéristiques de votre jeu de données identifiées, vous pouvez maintenant cerner le message que vous souhaitez véhiculer via votre visualisation. C’est à ce moment que vous donnez un but à votre visualisation!

    Gardez en tête que le message dépend grandement de votre auditoire. Il est alors important de bien identifier à qui s’adresse votre visualisation pour être en mesure de proposer des représentations efficaces avec un niveau de complexité adapté.

  3. Sélectionner un design adapté - le "comment"

    Un même jeu de données peut être représenté de plusieurs façons : en fonction de ses caractéristiques (quoi), du message à véhiculer et de l’auditoire identifié (pourquoi), vous pouvez déjà éliminer plusieurs représentations.

    À cette étape du travail, n’hésitez pas à faire des croquis à la main! Explorez différentes possibilités et déterminez leurs efficacités en fonction des éléments identifiés pour le quoi et le pourquoi.

  4. Encoder efficacement ses données

    Lors de la réalisation de votre visualisation, assurez-vous que vos données sont encodées efficacement. Une visualisation est composée de marques (points, lignes, formes géométriques etc.) dont l’apparence est contrôlée par des canaux (position, longueur, angle, surface, couleur etc.). Dans un diagramme à bandes, par exemple, la marque utilisée est une ligne (une bande), et les canaux sont la longueur (quantité) et la position (catégorie). 

    Il existe différents canaux visuels, mais leur efficacité diffère. Voici quelques règles d’or à suivre:

    • Encodez les attributs les plus importants avec les canaux les plus efficaces (position, longueur et surface);
    • Encodez un attribut par canal;
    • Assurez-vous que les différents canaux utilisés soient bien distinguables.
  5. Utiliser la couleur avec parcimonie

    De façon générale, évitez d’utiliser les couleurs comme canal principal. 

    Les nuances de couleurs peuvent être difficilement distinguables/différentiables. Dans le cas où la couleur est essentielle à votre visualisation, utilisez des couleurs contrastées. ColorBrewer et Adobe Color sont des outils web qui peuvent vous aider à sélectionner des couleurs adéquates.

    Il est aussi important de favoriser l’accessibilité de vos graphiques et de prendre en compte les personnes éprouvant des difficultés dans la perception des couleurs (par exemple le daltonisme). Des échelles de couleurs existent pour demeurer inclusif-ve.

  6. Être intègre dans ses représentations

    Plusieurs éléments peuvent affecter l’intégrité de vos visualisations, dont les mauvais choix de design. Vous devez donc porter une attention particulière aux points suivants lorsque vous concevez votre visualisation :

    • Débutez la graduation de vos graphiques à zéro (sauf s’il s’agit d’un diagramme à ligne brisée)
    • Utilisez une seule graduation d’axe pour chacun de vos graphiques
    • Ne pas utiliser de 3D
  7. Éviter les bruits graphiques

    Les bruits graphiques sont tous les éléments qui ne contribuent pas à la lecture d’un graphique. La règle d’or est de maximiser la surface consacrée à l’encodage des données dans une visualisation (ratio  » données vs encre «  de Tufte »). En d’autres mots, évitez d’utiliser des effets visuels qui ne servent qu’à taper l’œil. Supprimez tout ce qui n’est pas nécessaire, nuit à la lisibilité, ne répond pas à votre message principal.

  8. Bien contextualiser ses données

    N’ayez pas peur d’illustrer vos données en détail. Plusieurs peuvent avoir le réflexe de sursimplifier leurs graphiques par peur d’introduire trop de complexité… Cependant, un manque de contexte peut nuire à la lecture ou à la compréhension d’une visualisation.

    Une sur-simplification peut parfois introduire certains biais lorsque des données clés sont omises dans une visualisation. L’interprétation de ce graphique pourrait donc mener à des conclusions erronées. 

    Il est important de mettre vos données en contexte et de trouver un juste équilibre entre la quantité d’informations illustrée et son niveau de compréhension.

  9. Faciliter la lecture

    Finalement, il ne faut pas oublier les éléments entourant votre visualisation!

    Par exemple, tout graphique devrait avoir un titre ainsi que des noms d’axes descriptifs. Au besoin, vous pouvez aussi orienter les yeux de votre auditoire vers les éléments clés de votre visualisation à l’aide d’un encadré, par exemple.

    Ces éléments entourant la visualisation facilitent sa lecture et sa compréhension!

  10. Réévaluer le design

    Remettez constamment votre visualisation en question! Tout au long du processus de création, n’hésitez pas à modifier votre design ou à essayer de nouvelles manières de visualiser vos données. C’est parfois en essayant de nouvelles approches que l’on trouve la meilleure!

    Alors, êtes-vous prêt-e pour vous lancer en visualisation de données?

Auteur-e-s

  • Photo de Caroline Labelle

    Caroline Labelle

    Doctorante en bio-informatique

    Caroline complète présentement son doctorat en bio-informatique sous la supervision de Sébastien Lemieux (IRIC, UdeM). Son projet de thèse vise à appliquer les notions d’inférence bayésienne à l’étude de l’efficacité de composés chimiques, dans un contexte de découverte de médicament. La visualisation et la valorisation des données sont au centre de ces travaux : ce sont des moyens de communication et de partage de savoirs. La visualisation de données joue un rôle particulièrement important au près de ses collaborateurs d’autres domaines scientifiques (ex. chimie thérapeutique, biologie moléculaire).

  • Photo d'Antoine Béland

    Antoine Béland

    Concepteur de visualisation de données

    Antoine Béland est titulaire d’un baccalauréat en génie logiciel et d’une maîtrise en génie informatique de Polytechnique Montréal. Durant ses recherches à la maîtrise, il s’est spécialisé en visualisation de données où il a été dirigé par le professeur Thomas Hurtut. Il a été également développeur web pour le journal Le Devoir où il a conçu des visualisations de données au sujet de l’actualité.

Cet article a été produit en collaboration avec IVADO