Nous nous apprêtions à vivre un véritable marathon. Numériser 16 860 noms à partir de 1 100 rapports était un défi qui allait prendre du temps : les moins optimistes d’entre nous tablaient sur 3 mois. Nous avions donc décidé pour rythmer cette campagne de procéder en deux temps. L’équipe de Transparence International France étant en congés, Regards Citoyens lançait l’initiative le 4 août, puis l’équipe de TI devait, à son retour en fin d’été, la relancer auprès de ses réseaux. Votre enthousiasme pour cette opération en a décidé autrement ! Hier soir, alors que nos partenaires sont encore en vacances, la barre des 100 % a été atteinte : tous les noms sont numérisés.
À peine 24h après le lancement de l’application, 10% des personnes auditionnées avaient été numérisées et l’engouement s’est confirmé les jours suivants avec un relai de plus en plus intense sur twitter et identi.ca ainsi que sur de nombreux blogs. Nous tenons donc à remercier très chaleureusement pour leur aide les 3 214 internautes (et notamment les plus motivés d’entre eux) qui sont venus numériser avec nous au moins un nom !
Participation des internautes à l’opération de numérisation heure par heure
CC-by-sa – Regards Citoyens
Qui sont donc ces citoyens volontaires qui ont offert quelques minutes de leur temps à ce projet ? Difficile de le dire, mais nous avons tout de même quelques pistes. Au vu de la baisse de participation durant le week-end, il s’agirait plutôt d’une majorité d’actifs que de vacanciers. La #PauseCafé, comme l’a baptisée ls01, a probablement joué un rôle crucial ! En observant la participation moyenne sur une journée, on peut remarquer trois pics de participations : à 10h, 15h et 22h.
Le fonctionnement de l’application a d’ailleurs soulevé de nombreuses questions parmi ses utilisateurs. Notamment comment s’assurer que les milliers de participants contribuaient réellement et ne remplissaient pas aléatoirement nos formulaires ? Pour le garantir, chaque nom a été traité par 3 à 7 internautes différents. Si deux d’entre eux indiquaient les mêmes informations pour chacun des champs saisis, nous considérions l’information valable. Sur les près de 17 000 noms à traiter en tout, nous n’avons été obligés de faire intervenir au moins un 4ème internaute que pour 2 500 d’entre eux. Cela n’était pas le fait de « vandalisme » : il s’agissait simplement de cas complexes pour lesquels une vérification accrue s’est montrée nécessaire et fructueuse.
Autre question fréquente : comment avions-nous pu repérer ces milliers de noms au sein des rapports ? Ce travail s’est déroulé en deux étapes. Il a fallu dans un premier temps identifier au travers de plusieurs dizaines de milliers de pages de rapports, les seules sections dédiées aux listes de personnes auditionnées. Ceci fait, nous nous sommes attelés à en retirer la seule information que nous pouvions identifier de manière automatique sans trop d’erreur : les noms des auditionnés. Nous avons procédé pour cela en deux temps : un premier programme identifiait les noms et prénoms en se basant sur une pratique commune à l’Assemblée de préfixer les noms par un « M. » ou « Mme » et quelques variantes. À partir de ces premiers résultats, un second logiciel est venu compléter la liste en utilisant les prénoms déjà identifiés pour s’assurer qu’aucune personne n’avait été oubliée. C’est ainsi que France étant également un prénom, certains d’entre vous se sont retrouvés confrontés à devoir signaler des lobbyistes qui n’en étaient pas, comme France Télévisions ou France Télécom.
Représentation graphique du repérage des personnes auditionnées dans deux rapports
CC-by-sa – Regards Citoyens
C’est à partir de cette première base de résultats que nous avons pu proposer une interface web d’utilisation la plus simple possible pour qualifier chacun des noms. Comme à notre habitude, tous les logiciels que nous avons réalisés pour ce projet sont diffusés librement (téléchargeable sous licence Affero-GPL). Développés en quelques jours, ces programmes sont perfectibles. Nous envisageons de les rendre plus génériques afin qu’ils puissent mieux profiter à la communauté.
Maintenant que cette première partie a été réalisée grâce à votre aide, il reste encore du travail : il faut désormais analyser les données et réfléchir avec TI à ce qu’il nous sera possible d’en tirer. Comme toujours, nous rediffuserons l’ensemble des données résultantes librement, mais d’ici quelques semaines seulement, le temps de voir avec la CNIL dans quelle mesure ces informations pourrons être partagées : contenant des données personnelles, même issues de documents publics, leur diffusion est moins évidente au regard de la législation que pour des données non nominatives.
Pour être tenu informé de l’évolution de ce travail, n’hésitez pas à vous inscrire à notre lettre d’information.
Félicitations, c’est vraiment impressionant et un example de crowdsourcing qu’on peut utiliser pour beaucoup d’autres projets dans le futur. (Et c’est presque sûr que je vais le mentionner au Personal Democracy Forum (PDF) à Barcelone début octobre 🙂 )
Ronny, Transparency International Liaison Office to the EU (Bruxelles)
Bravo pour cette initiative qui démontre la forte implication des internautes (qu’il pourrait etre intéressant de comparer à l’activité des téléspectateurs…) pour les questions de société aussi importantes que le lobbying.
Il pourrait être très intéressant d’appliquer le même principe aux débats et journaux télévisés, ainsi qu’aux autres médias de masse pour voir quels sont les invités, quel est leur temps de parole et quel est leur lien avec les multinationales et les partis politiques et quelle part est consacrée aux informations d’importance.
« des lobbyistes qui n’en étaient pas, comme France Télévisions ». En effet dans ce cas ça s’apparente plus a de la propagande qu’a du lobbying… 🙂 c’est moins discret mais tout le monde sait bien que plus c’est gros plus ca passe.
Merci de vous occuper de rendre la démocratie plus transparente. Internet est désormais un contre-pouvoir incontournable et c’est tant mieux !
À propos de crowdsourcing, je constate que (souvent) la participation à tendance à rapidement décroitre. Et ça a l’air d’être quand le projet est ambitieux. J’ai l’impression qu’il n’y a pas ce genre de phénomène pour les petits projets… mais bon, ce n’est plus du crowdsourcing s’ils sont petits !
Je ne sais pas si c’est parce que : soit il y a beaucoup de participants (et, ne se sentant pas spécialement responsables, ils arrêtent plus facilement), ou soit c’est la quantité de choses restantes à faire (oubliant qu’ils ne sont pas tout seuls, ils ont le sentiment qu’ils n’y arriveront pas). Ou, c’est peut-être de la psychologie… quelque chose comme une « loi de Parkinson » (c’est-à-dire « le travail s’étale de façon à occuper le temps disponible pour son achèvement »).
Et est-ce qu’il y a aussi une forme de concurrence entre les projets de crowdsourcing ? C’est-à-dire que, travaillant sur un projet, est-ce qu’il y a un manque (temporaire) sur les autres projets ?
Et, est-ce que le choix de la licence joue un rôle dans la participation ?
Et les pays aussi… est-ce que la nationalité joue un rôle dans la participation (participation moyenne, décroissance de la participation, etc.) ?
Bref, tout plein de questions intéressantes ! 🙂
Merci à vous, merci à nous 🙂
Vivement les résultats !
Initiative intéressante pour deux raisons : celle de mettre en lumière des rapprochements certainement très parlants (à l’occurrence, le lobbying et les évolutions politiques, économiques et sociales…)
Celle aussi de permettre au simple citoyen d’agir, même à un tout petit niveau.
Je trouve cette initiative très intéressante. Je pensais y participer à la rentrée, mais le boulot est déjà fait !
Comment pensez-vous représenter les résultats ? Tableaux ? Cartes graphiques plus « parlantes » ? J’attends la suite avec impatience.
[…] 17/08 11h45] Regards Citoyens a annoncé ce lundi avoir achevé son travail de crowdsourcing avec près de trois mois d’avance sur les […]
Bravo pour cette initiative et la simplicité d’utilisation de l’interface qui a rendu l’exercice ludique et donc motivant.
Réponse partielle aux questionnements de goutte d’eau:
Pour ma part j’ai de moins en moins participé non pas par manque d’intérêt mais parce qu’au fur et à mesure des tris, les renseignements devenaient de plus en plus complexes à fournir: personnes sans le nom de l’entité qu’ils représentent, personnes « multifonctions » et autres cas spéciaux. Et dans le doute, je me suis abstenue.
Par contre la théorie de la pause café marche bien pour moi 😉
Vivement la publication de l’étude !
j’ai hate de voir ce qu’il va en ressortir et je participerais encore volontiers à une autre sollicitation de ce genre car ça me donne l’impression d’agir en tant que citoyen.
à quand la « numérisation de l’utilisation de l’argent du contribuable » ? car la cour des comptes est bien seule et bien démunie face aux excès de ceux qui ont des pouvoirs !
Et maintenant, si vous êtes sincères, livrez le fichier au public sous un format ouvert et exploitable sans tracas.
[…] semaine en France, le collectif regardscitoyens et Transparency International ont finalisé la numérisation des lobby… du parlement français. Plus de 3000 internautes ont participé à cette initiative; superbe […]
[…] This post was Twitted by S_Lamour […]
[…] pour réaliser le projet à la collecte des données web… Regards Citoyens utilise également avec succès le crowdsourcing, outil participatif visant à recueillir quantité d’ informations. Mais le mouvement de […]
Bonjour
Où en est ce projet? Un rapport est il prévu par TI?
Salut Rod!
Nous sommes un peu en retard mais cela arrive très vite oui! A suivre très prochainement sur Twitter et par mail pour les inscrits sur http://www.regardscitoyens.org/info-publication-etude-lobbyistes/ !
A bientôt,
Roux
[…] nous avions pu le faire par le passé pour explorer les auditions des rapports parlementaires, nous avons donc ouvert quelques heures après la publication des documents par la Haute Autorité, […]
[…] site relève que pour explorer les auditions des rapports parlementaires, ils ont donc ouvert quelques heures après la publication des documents par la Haute Autorité, un […]