Mini-mémoire atelier Open Data
Ce mémoire est publié sous la licence libre .
Les participants (et auteurs)
Formateur :Tangui Morlier
Compétences acquises
Présentation de l'introduction sur l'Open DataQu'est ce qu'une donnée ?
C'est une description élémentaire, souvent codée d'une réalité (wikipédia).On distingue différents types de données. On parle souvent de données qualitatives et quantitatives mais il y en a d'autres, celles qui catégorisent, qui sont dites discretes (celle qui définissent numérairement l'echantillons de départ) ou bien encore les données "continues" (données qui ne varient pas).Qu'est ce que l'open data ?
Les Open Data sont des données ouvertes qui ont la particularité de relèver du service public, d'être non personnelles et non soumises au secret. Souvent les données ne produisent pas de sens à l'unité, mais une fois mises ensembles, traitées, elles permettent de réaliser des comparaisons, elles peuvent être analysées et générer de l'information. Pour qu'une donnée soit interprétable, analysable, il faut la rendre audible (pour nos oreilles), la rendre visible (pour nos yeux), décodable (pour un ordinateurs :-)
Les données traitées permettent de construire un discours, en tant que lecture de la réalité elles ont une importance fondamentale dans de nombreux domaines. Il y a donc de forts enjeux attachés aux données.Les données pevent être exportées au format csv. Sous ce format, les données qui sont des chaînes de caratères doivent être mises entre guillemets et séparées par des virgules :
"rouge", 12, "Bretagne",46.34
Bien d' autres formats de données existent. L'ensemble de ces formats sont listés ici. Comment se procurer des données ?
Il existe principalement trois moyens de se procurer des données : - Trouver des données déjà disponibles, celles qui sont en ligne, en ayant pris toutes les précautions en terme droits d'auteur et droit sui-généris des bases de données (qui valorise l'organisation des données)
S'y retrouver dans les licences open data - Réclamer des données auprès des sources officielles, par exemple en application des lois sur le droit d’accès et de réutilisation des données publiques (loi CADA de 1978 en France). Parfois une donnée est publiée en ligne mais n’est pas directement téléchargeable, ne vous découragez pas pour autant. Cette donnée peut être récupérée par les méthodes dites de « scraping ».
- Collecter des données et les intégrer dans une base de données ou une feuille de calcul.
Comment libérer des données en Open Data ?
La libération des données, c'est facilité l'accès et la réutilisation des données d'intérêt général. Cette activité peut être menée seule ou à plusieurs, de manière collaborative.Libérer les données publiques, c'est contribuer au bien commun, permettre leur valorisation, oeuvre pour la transparence et la démocratie.Après avoir vérifier que les données pourront être mises en ligne autrement dit que l'on possède les droits d'auteurs et sui-généris recquis, il faut : - choisir une des deux licences libres s'applicant aux données (Licence Ouverte ou ODBL)
- mettre les données en ligne
- enregistrer le jeu de données sur portail Open Data comme data.gouv.fr
Qu'avons nous appris ?
- Nous avons appris à "nettoyer" des données.
- Pour être retraitées, les données doivent être normalisées, homogènes.
- Nous avons nettoyé les données sous libre office calc et dans open refine.
Quelles sont les principales fonctionnalités de Open Refine ?
La visualisation des données à travers Open Refine
L'édition massive des données via la clustrisation
Les réalisations
Nous avons extrait des données 3 sources de la BIDULL, de ressources privées et de data.gouv.fr nous les avons nettoyés dans libre office calc puis dans open refine;Les visus de la Bidull
La base BIDULL ( base de données Ultra Légère et Libre) est issue de l'intranet du réseau Français des Petits Débrouillards et recense l'emble des activités Petits Débrouillards sur le territoire français.Les évènements Bidull par nombre de participants (taille de la bulle)
Le nombres de visiteurs dans le temps
Les cartes des évenements
Les marchés publics
Ces données une fois nettoyées, nous avons travaillé à leur visualisation. Pour les visualiser nous avons utilisé dataraw, uMpa et raw density design. Nous avons sélectionné certaines catégories de données qu'il nous semblait intéressant de représenter sous forme de cercles, de diagramme...
Budget de APDGE
Il s'agit d'un point budgetaire des antennes de l'Association des Petits Débrouillards du Grand Est réalisé au 1/11/14 ...« Les personnages et les données de cette infographie étant purement fictifs, toute ressemblance avec des données ou des situations existantes ou ayant existé ne saurait être que fortuite. » L'infographie à été faite avec http://infogr.amLa médiation sur les thèmes des données
Sources
- Présentation de Tangui
- Prise de notes collective : https://pad.lqdn.fr/p/cnam-atelier-opendata
- Visualisation des notes collaboratives : https://regardscitoyens.github.io/HTML-pad-preview/#https://pad.lqdn.fr/p/cnam-atelier-opendata
Logiciels et website utilisés
Pour traiter et nettoyer les données
Pour faire des infographies
- http://umap.openstreetmap.fr/fr/
- https://datawrapper.de/
- http://raw.densitydesign.org
- http://www.wordle.net
- http://www.easel.ly
- http://www-958.ibm.com/software/analytics/manyeyes/
- https://infogr.am/app/#/home
Pour faire de la cartographie
- umap
- https://nominatim.openstreetmap.org
- http://openstreetmap.fr/bano
- http://www.latlong.net
Pour avoir des ressources
- http://ecoledesdonnees.org/
- https://www.data.gouv.fr/fr/
- http://fr.okfn.org/
- http://datarmor.cotesdarmor.fr
- http://www.rade-brest.fr/VIPRR91/Interligo.Web.Front/front.aspx
- http://www.nosdonnees.fr/
- http://jplusplus.github.io/guide-du-datajournalisme/pages/0501.html
- http://data.worldbank.org/
Les communautés identifiées
- http://www.regardscitoyens.org/nous-aider/
- http://openstreetmap.fr/
- libertic
- open data rennes
- okfn france
- http://www.bretagne-creative.net
La médiation sur le thème des données ?
Nous l'avons vu rapidement, il y a de forts enjeux autour des données, ....Pour Xavier Crouan, Directeur de l’Information et de l’innovation numérique à la Ville de Rennes et à Rennes Métropole, "La libération des données publiques, ou open data, induit une autre manière de travailler. Elle transforme la relation à un territoire". L'appropriation des données permet de créer de nouveaux savoirs, d'amener à de nouvelles lectures, de nouvelles interprétations.Le numérique permet d'augmenter considérablement l'accès et la réutilisation des données.
Faire de la médiation sur le thème des données c'est :- permettre de découvrir ce qu'est une donnée
- permettre de découvrir ce qu'est une donnée libre
- permettre de découvrir les producteurs et les systèmes de production des données
- permettre de comprendre les enjeux liés aux données
- s'appropier la technique amenant à la valorisation des données
- permettre de jouer avec les données, créer de l'analyse, créer de l'information
- favoriser les démarches collaboratives et l'engagement citoyen
- faire de l'éducation aux statistiques, aux médias
- s'approprier des méthodes des sciences humaines
Ce débat s'est tenu notamment lors des JIES 2014 à l'ESPGG. Bibliographie et webographie sur l'Open Data