Partie de l’exemple des représentations des circonscriptions et de l’activité des députés sur notre site, la discussion a évoqué les différents enjeux de la repésentation de données au travers de nombreux exemples.
La question de la source, de la validité et de la disponibilité de la donnée brute est d’abord apparue comme essentielle. Même les données brutes présentent toujours une part de subjectivité. Un travail rigoureux est donc indispensable à la préparation de ces données dès lors qu’elles vont donner lieu à une représentation visuelle. Cela est d’autant plus important lorsque l’on a à sa disposition un volume important de données très diverses. Il existe des rêgles scientifiques de la visualisation (et des livres très précis sur le sujet existent) et c’est un travail de statisticien que de mettre vraiment en valeur les données réutilisables et de quelle façon afin d’éviter toute perte de neutralité due à la représentation.
C’est pour cela qu’il apparaît très important de proposer des schémas simples. Afin d’assurer un maximum de lisibilité pour le grand public et ainsi éviter toute mauvaise interprétation, il faudra éviter de présenter une multitude de données comparées mais préférer se concentrer sur quelques données bien choisies, tout en donnant accès aux autres sur d’autres représentations. La gamme de couleurs choisie peut également jouer un rôle majeur dès lors qu’une forme d’évaluation est proposée. Un exercice simple est conseillé pour évaluer la qualité d’une représentation : le faire circuler parmi un échantillon de personnes aussi diverses que possible et leur demander d’exprimer clairement ce qu’ils comprennent et observent.
Les données brutes doivent de toute façon être au maximum possible disponibles afin de soumettre à l’attestation de chacun leur validité. Et pour plus de transparence et d’interactivité avec le lecteur/utilisateur, il convient de ne pas concevoir une représentation comme une voie sans issue mais au contraire comme une passerelle vers l’information complète ou vers d’autres formes de visualisation. Une telle interactivité offre par ailleurs à l’utilisateur la dimension d’empowerment qui permettrait de susciter de nouveaux usages et de proposer de donner naissance à de nouvelles formes de visualisation.
Un accès plus « fun » aux données permettrait de stimuler des expériences et d’initier un mouvement. La récupération des données est avant tout un travail d’ingénieur, le choix des données celui d’un sociologue ou d’un politologue et leur représentation celui d’un graphiste. Pour voir émerger le travail de spécialistes de la visualisation il convient de proposer en plus de ses propres représentations simples et lisibles un accès simplifié aux données idéalement sous la forme d’API mais aussi avec des dumps bruts de bases de données ou bien des tableurs.
Des outils comme Manyeyes (qu’illustre bien l’exemple ci-dessus de la représentation des recettes de l’Etat en treemap présentée lors de la discussion) ou Gapminder (qui offre des possibilités de suivi dans le temps comme par exemple sur les données de l’OMS ci-dessous, qui auraient permis de mettre en évidence des erreurs de traitement de la part de l’institution) permettent ainsi ensuite de réutiliser les données brutes dans des interfaces conçues pour et manipulables facilement par les visiteurs.
D’autres exemples en vrac évoqués durant la session :
- Where Does My Money Go?
- The Jit
- Places & Spaces par SciMaps.org
- DataMasher
- PearlTrees
- New Political Interfaces et tout particulièrement leur application What are they talking about?
[…] in Paris, where more than 120 people came to learn and share their skills. We learned a lot about information visualisation techniques from existing projects and from interesting theoretical ones! We also had a good conversation with […]
[…] expériences. Nous y avons appris beaucoup, que ce soit sur l’existant, les techniques de visualisation de données ou les possibles projets de diffusion. Ce fut également l’occasion d’échanges […]