Trois mois après la formation de l’équipe en charge de créer le futur portail data.gouv.fr, un décret et une circulaire sortis au Journal Officiel ce matin viennent préciser le cadre dans lequel ÉtaLab et les ministères vont travailler.
Coup de frein à la marchandisation des données publiques
Le décret 2011-577 risque de ne pas faire plaisir à tous les intermédiaires qui vivent de la revente de données publiques sur le dos du travail des administrations. A partir du 1er juillet 2011, il sera beaucoup plus complexe pour une administration centrale de créer des barrières financières à l’accès à ses données publiques. Alors qu’elle pouvait jusqu’alors le faire sur simple initiative de son ministère de tutelle, elle devra désormais demander l’avis du Conseil d’orientation de l’édition publique et de l’information administrative (COEPIA) et la publication d’un décret dédié (donc après validation par les services du Premier ministre). Ce décret représente donc bien, comme le sous-entendait François Bancilhon de Data-Publica ce matin, un camouflet pour l’APIE qui milite depuis de longs mois pour la généralisation des licences payantes.
Cependant, s’il renforce le poids du Premier ministre dans l’arbitrage de la création de licences payantes, il réaffirme également celui du COEPIA. Créé en janvier 2010 pour plancher sur l’édition publique et l’information administrative, cet organisme à la composition controversée donne une large place aux industries privées de la vente de données publiques. La gouvernance de cet organisme est sans nul doute la plus grosse faiblesse du mécanisme introduit aujourd’hui par le Premier ministre. Si la volonté politique de limiter la mise à disposition payante est bien réelle, il faudrait doter le COEPIA de moyens de contre-balancer l’influence mercantile de ces acteurs privés.
Les données payantes le resteront au moins jusqu’en 2012
Les administrations qui pratiquent depuis longtemps la vente de leurs données conservent par ailleurs un délai de 13 mois pour recenser leurs licences payantes et les faire enregistrer, sans quoi ces licences deviendront caduques au 01 juillet 2012 et passeront sous le régime gratuit par défaut. Nul doute que l’IGN saura se saisir de cette opportunité pour poursuivre et entériner la politique de fermeture nationale en matière de données géographiques.
Enfin, ce mécanisme visant à assurer une meilleure transparence de la publication des données publiques, ne s’appliquera pas à tous les organismes ayant une mission publique. Les EPIC comme le BRGM ou les sociétés privées chargées d’une délégation de service public, comme les entreprises privées de transports en commun, pourront continuer à restreindre voire à faire payer l’accès aux données qu’elles produisent.
data.gouv.fr référencera-t-il également des données payantes ?
Si le décret publié aujourd’hui dissuade la création de données publiques payantes, il n’en annonce pas pour autant la fin. Ces dernières seront référencées sur un site unique. Les ventes controversées des bases de données des prix du carburant ou des répertoires d’entreprises seront donc référencées publiquement sur un « site internet créé sous l’autorité du Premier Ministre ». Plus besoin donc d’en découvrir l’existence en épluchant le Journal Officiel ou les projets de lois.
Bien que la formule annonçant le recensement centralisé des données publiques payantes manque de clarté, elle semble tout de même indiquer que la mission ÉtaLab sera en charge de ce site. L’équipe de data.gouv.fr choisira-t-elle de créer un nouveau site ou va-t-elle mélanger les données « OpenData » (données publiques librement réutilisables) avec des données payantes, quitte à perdre en lisibilité ?
Une licence gratuite pour data.gouv.fr
À travers la circulaire publiée aujourd’hui, le Premier ministre recommande la mise à disposition gratuite de toute information publique, produite par un ministère ou un Établissement Public et Administratif, sous le régime d’une licence gratuite. Les termes de cette dernière doivent être rédigés par la mission ÉtaLab en concertation avec le COEPIA et l’APIE d’ici au 24 Août 2011 (3 mois). La circulaire leur demande pour cela de s’inspirer des « licences libres et gratuites » de ces mêmes organismes. L’effort sémantique est louable pour la forme mais son application semble plus que difficile puisque l’APIE n’a encore jamais produit de licence libre… Reste à croiser les doigts pour que les licences réellement libres, comme l’ODbL employée notamment à Paris ou au Maroc, soient également sources d’inspiration.
Outre cette licence supposée libre, le risque d’une démultiplication des licences reste malheureusement possible, car les administrations pourront élaborer avec l’APIE des licences gratuites spécifiques aux conditions variables (et en dernier recours payantes tout en cherchant à « favoriser l’innovation » sic…). Il conviendra de les surveiller attentivement au sein du futur catalogue de data.gouv.fr.
Des « correspondants données publiques » nommés dans chaque administration
Déjà apparus dans plusieurs ministères depuis quelques semaines, les correspondants données publiques sont officialisés via cette circulaire et devront tous être nommés sous 10 jours. Sous la responsabilité des secrétaires généraux, ces correspondants seront chargés de coordonner le travail d’identification, de recensement, de qualification (nom, source, date, version, mainteneur, licence d’origine, mots-clés) et de publication des données publiques. Ils seront également chargés d’assurer le suivi auprès des réutilisateurs des données de leur administration.
ÉtaLab publiera dans quelques semaines un guide technique à leur intention afin d’orienter leur travail en la matière.
Des formats de publication conseillés mais pas clairement définis
La circulaire s’attarde enfin sur la question des formats. Si cette partie présente l’avantage de catégoriser les types de fichiers à utiliser, elle se montre sans doute la plus décevante. Plutôt que de parler de formats ouverts, la circulaire cite des exemples d’extensions de fichiers numériques. Une extension de fichier dédiée aux tableurs (.ODS) est même malencontreusement citée dans la catégorie des « formats textes ». Il aurait sans doute été plus pertinent de citer le format décrivant ces fichiers : l’Open Document Format.
De plus, la circulaire cite également pour les tableurs l’extension .XLS, qui implémente un format propriétaire. Ce type de format pose de vrais problèmes de discrimination envers les utilisateurs. À tout moment, le propriétaire de ce format peut en restreindre l’utilisation ou intimider juridiquement les développeurs des applications en faisant usage.
Notons tout de même la recommandation d’employer des fichiers interopérables, notamment de type CSV, XML, KML ou encore RDF, formats ouverts que l’on espère voir largement favorisés par les administrations. On peut enfin relever une bonne nouvelle : celle de recommander à l’administration de prévoir dans ses prochains développements logiciels l’utilisation a minima de « formats interopérables ». Cela permettra d’éviter à certains ministères ou administrations d’être dans l’incapacité de maîtriser et exporter les données qu’ils produisent, comme c’est souvent le cas aujourd’hui.
La gratuité : un premier pas vers l’OpenData
La loi CADA consacre depuis de nombreuses années un droit d’accès et de ré-utilisation non-discriminatoire pour les données et informations publiques. En favorisant la gratuité, l’impulsion donnée aujourd’hui par les services du gouvernement va globalement dans le bon sens. Si les barrières financières sont les plus connues des restrictions, elles ne sont pas pour autant les seules : les freins juridiques, administratifs ou techniques sont bien réels et répandus.
Espérons que la mission ÉtaLab sera aussi attentive à ces autres éléments, par exemple en généralisant l’usage des formats ouverts et des licences réellement libres reconnues au niveau international.
enfin !
Mais alors, concrètement, qu’est ce qui change? Les données payantes restent payantes, les administrations qui souhaitent tarifer le pourront toujours, même s’il faut l’avis du COEPIA, mais comme le dit le billet, celui-ci est contrôlé par les industriels…
Ca ne sent pas un peu le coup politique en vue de 2012 tout ça? Un petit effet d’annonce en plus. J’espère que RC suivra ce dossier d’un oeil critique comme il l’a fait dans le passé.
Il est dommage qu’on ne se pose pas la question du contenu et de la définition exacte de ces « données publiques ». qu’il est subitement si urgent de remettre à des sociétés privées proches avides de les vendre à des entreprises de sécurité et de …. surveillance, voire plus. On est fort loin de ce qu’affiche vertueusement le gouvernement en matière de données publiques (horaires des bus, adresse des services publics, statistiques non nominatives, …..).
Notrefamille.com et Ancestry, deux entreprises de généalogies attaquent depuis maintenant deux ans les services d’archives départementaux pour obtenir sous couvert de généalogie de loisir tout un tas de données personnelles (cela s’appelle « vulgairement » des archives historiques : registres paroissiaux, état civil, listes d’habitants, recensement de population,registres d’hôpitaux et de camps de déportation, ficheirs militaires, dossiers de personnel, dossiers médicaux ….).
Le gouvernement a tente d’intimider les collectivités publiques en leur imposant une réglementation contraignante en faveur de ces sociétés et de pousser au contournement de ces collectivités gestionnaires de ces données. En gros, elles n’ont pas le droit de refuser des « partenariats » imposés, léonins et prédateurs.
Il n’y a eu AUCUN DEBAT PUBLIC sur la définition des « données publiques », puisque la réglementation française résulte d’une adaptation à la hussarde et dévoyée d’une directive européenne, faite sur ordonnance et sans débat au Parlement : l’administration détient de quoi nous ficher tous sur plusieurs générations, et le gouvernement pousse à la concentration de ces données extrêmement sensibles (fichiers pénitentiaires et judiciaires, fichiers de police ….) entre les mains de lobbies douteux (généalogique génétique et raciale, assureurs, banquiers) clients de ces sociétés, en mettant à profit la mode de la généalogique personnelle. Cherchez qui exactement finance Ancestry, mais aussi Facebook, qui a subitement trouvé urgent en 2010 de se rapprocher de la France et de Pierre Kosciusko-Morizet via une adhésion à l’ASIC, tout en révélant à plusieurs reprises les données personnelles de ses profils inscrits …. Cherchez pourquoi le ministère de la culture a fait disparaitre le secteur archives au sein des musées (destruction de la Direction des Archives de France et des Archives nationales, constitution d’une « direction générale des patrimoines de France), sinon pour cacher cette affaire gravissime pour les libertés individuelles.
Est-ce là l’avenir que nous voulons pour nous, nous concitoyens et nos descendants ??????
L’association des archivistes français a protesté publiquement et les collectivités ne se sont pas laissées faire. Aucun service d’archives n’a remis de données ou de documents à ces sociétés, , comme il en était grossièrement et violemment sommé.
Association des archivistes français : http://www.archivistes.org/La-reutilisation-des-donnees
Et les très instructifs enregistrements de la journée d’études que cette association professionnelle a consacré au sujet le 11 mars 2011 : http://www.archivistes.org/La-reu-ti-li-sa-tion-des-don-nees
[…] La gratuité des données publiques encouragée par data.gouv.fr (Regards citoyens) […]
@virginie :
Regards Citoyens continuera bien évidemment à suivre de près le dossier avec le même regard critique, pas d’inquiétude 🙂
edit : vous pouvez d’ailleurs le constater en suivant nos comptes de microblogging identi.ca/twitter, sur lesquels nous tenons une veille quotidienne sur ces questions, et sur lesquels nous avons notamment pointé certains travers portés pour le moment par l’INSEE : http://search.twitter.com/search?q=fail+opendata
@Le Minie :
Nous sommes parfaitement d’accord que les données personnelles doivent toujours être protégées et que la définition des données publiques se doit de bien être circonscrite aux données dépourvues d’informations personnelles qui sont et doivent rester de la juridiction de la CNIL.
Vous voulez voir un exemple ubuesque de fermeture des données publiques ? http://www.carburantfute.fr/
Ah tiens, ça existe encore l’IGN ?
Enfin, bref, tout le monde ne peut pas avoir l’intelligence de gagner de l’argent avec du gratuit…..
Dommage que le gouvernement n’ait pas encore compris le principe de destruction creatrice. (http://fr.wikipedia.org/wiki/Destruction_cr%C3%A9atrice)
Le web certes peu provoquer des pertes de monopole, mais en meme temps genere de nombreuses initiatives personnelles, creatrices de valeurs… Apparemment, il y a encore des reticences, a la ratp par exemple (http://www.journaldumac.com/2011/06/21/la-ratp-nest-pas-contente/). Mais bon, mis a part les requins/lobbyist qui tirent la couverture, cet article est un bon signe !!
[…] », précise, avec son franc-parler habituel, l’association Regards citoyens dans une tribune consacrée au futur portail […]
[…] format propriétaire XLS, correspondant au tableur Excel de Microsoft. Comme le notait le site Regards Citoyens en mai dernier lors de la parution du décret 2011-577 relatif à la réutilisation des […]
[…] Sur les parties parlementaires, on a réussi à développer une gamme de sites et de fonctionnalités qui est vraiment riche et qui permet de faire ce qu’on imaginait il y a trois ans. Sur le second plan, qui est l’open data, on est très content d’avoir influé sur la décision d’Etalab d’avoir imposé la gratuité et une licence libre. […]
[…] précise, avec son franc-parler habituel, l’association Regards citoyens dans une tribune consacrée au futur portail […]