Enseignant

Samuel Goëta

Maître de conférences à Sciences Po Aix et co-fondateur de l'association coopérative Datactivist

Ancien Alumni devenu maître de conférences à Sciences Po Aix, Samuel Goëta revient sur son objet d’étude fétiche, l’open data, qui est au cœur de son dernier ouvrage “Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs.” !

Pouvez-vous vous présenter ? Quel est votre parcours académique ?

Je suis diplômé de Sciences Po Aix depuis 2011 : durant mes études, j’ai suivi le Master Information et Communication, ainsi que le Master Médias Informatisés et Stratégies de Communication au CELSA.

J’ai travaillé pendant deux ans en agence de communication : à cette époque, j’avais déjà un grand intérêt pour les sujets liés à l’ouverture des données. J’ai par la suite rédigé une thèse en sociologie sur les politiques d’open data qui émergeaient à l’époque, en essayant de comprendre comment l’ouverture des données se déroulait dans les administrations, son impact sur le fonctionnement de l’administration et enfin comment cela modifiait la donnée en elle-même.

Avec Joël Gombin, un autre Alumni de Sciences Po Aix, j’ai créé en 2016 une société coopérative appelée Datactivist. Aujourd’hui, c’est une société qui rassemble une vingtaine de coopérateurs, c’est-à-dire des salariés qui sont aussi associés et qui travaillent un peu partout en France pour accompagner des projets d’ouverture ou de réutilisation de données à travers du Conseil, des études, de la formation et de la médiation. Nos clients sont principalement des acteurs publics, des collectivités locales, l’État et aussi un certain nombre d’acteurs de l’enseignement supérieur sur les questions liées à la science ouverte.

Enfin, depuis maintenant un peu plus de trois ans, je suis maître de conférences associé à Sciences Po Aix, où j’enseigne principalement dans le Master Métiers de l’information que je codirige avec Magali Nonjon. J’enseigne sur les sujets liés à la science, au numérique, la transformation numérique de l’État, et enfin toutes les questions liées aux données.

Comment vous est venue l’idée de faire de l’open data votre champ de recherche ? De quoi s’agit-il ?

En réalité, j’ai toujours été intéressé par les sujets qui mêlent numérique et politique. À Sciences Po Aix, j’ai travaillé sur la question de la neutralité du net et du filtrage de l’Internet dans le cadre de mon mémoire “Neutralité du net, filtrage et régulation du réseau : libertés américaines, Liberté française”.

Suite à ce mémoire là, j’ai vu émerger la question de l’open data qui m’intéressait beaucoup, parce qu’il y avait à la fois des promesses de renouvellement de la transparence, qui étaient parfois un peu faramineuses, des promesses de développement de l’innovation et des promesses de transformation de l’administration.

Et puis je voyais aussi tout le potentiel derrière, surtout pour la démocratie. Cela change beaucoup de choses de partager des données, ce n’est pas la même chose que de partager de l’information ! Les données sont la base de l’information et du savoir, c’est à partir des données qu’on arrive à renouveler notre vision du monde, et donc je me suis dit que c’était quand même un objet d’étude intéressant.

Dans le même temps, j’ai monté l’association Open Knowledge France qui existe toujours et qui fait partie du réseau international Open Knowledge International. Cette association défend l’ouverture du savoir sous toutes ses formes et, depuis quatre ans maintenant, elle s’accompagne aussi d’un portail qui s’appelle madada.fr, créée pour faciliter l’accès des particuliers à leurs documents administratifs.

L’open data était-il un objet de recherche nouveau à ce moment-là ?

Quand j’ai commencé ma thèse, les recherches portaient principalement sur l’usage des données. Il manquait donc une littérature sur la manière dont le projet d’ouverture des données se construit en amont.

Je souhaitais précisément étudier comment se déroule un projet d’open data. Finalement, je me suis rendu compte dans mes recherches que l’existence même des données dans les administrations n’avait rien d’évident. Ainsi, l’une des premières actions d’un chargé de projet en open data est d’instaurer la donnée comme outil quotidien de l’administration.

Ce n’est qu’une fois ce travail terminé que j’ai, par la suite, étudié la phase d’ouverture des données. On a longtemps eu l’image que l’open data était aussi simple que de mettre en ligne un fichier. En fait, c’est beaucoup plus compliqué parce qu’il faut déjà savoir qui les produit et comment ; savoir aussi comment arriver à les extraire parce qu’elles sont souvent encapsulées dans des logiciels, dans des outils qui ne permettent pas l’extraction des données ; savoir les transformer pour qu’elles soient utilisables en les documentant ; savoir les mettre dans certains formats etc. Le travail est donc considérable et sous-estimé.

C’est dans les coulisses de l’open data qu’on va rendre possible ou non certains usages, que certaines données vont être sélectionnées ou non. Au final, l’open data varie en fonction de ce travail. On peut avoir des données qui vont effectivement servir à la transparence et d’autres qui ne sont pas exploitables ou qui ne répondent pas aux besoins des usagers ! Sur ce dernier point, nous avons encore du travail. Il faut mieux comprendre les besoins des usagers pour adapter l’open data.

L’idée d’une ouverture des données de nos administrations et des entreprises pourrait sembler antinomique avec la protection de nos données personnelles. Comment concilier une éthique de la transparence avec la protection de nos données sensibles ? Tout peut-il être divulgué ?

Depuis 2016 avec la loi pour une République numérique, toutes les administrations de plus de 50 agents et toutes les collectivités locales de plus de 3500 habitants sont concernées par une obligation de publication des données qui présentent un intérêt économique, social ou environnemental. Cette loi a instauré un principe d’open data par défaut, une loi qui en fait la norme plutôt que l’exception.

Dans les faits, on voit qu’il y a d’énormes fractures à la fois territoriales, mais aussi des pans entiers de l’administration qui ne se sont pas saisies de ces obligations d’ouverture des données. C’est justement là où c’est essentiel d’agir. Il faut mettre en avant l’importance du droit d’accès aux documents administratifs qui est issu de la loi CADA de 1978 et qui créer donc le droit de pouvoir accéder à tous les documents et de toutes les données qui sont produites par les administrations dans le cadre de leur mission de service public. C’est d’ailleurs un droit qui a été reconnu à valeur constitutionnelle en 2020 par le Conseil constitutionnel.

Le type de données qu’on va trouver en open data vont donc être les délibérations des collectivités, les subventions, des données très pratiques comme les horaires des transports publics, la localisation des bornes de recyclage, la pollution de l’air, les données météo, les données cartographiques, les inégalités scolaires… Finalement, tout peut être mis en open data, à l’exception quand même – et c’est notable, des données à caractère personnel.

En effet, l’open data s’inscrit dans le respect de certains documents administratifs où le secret est admis et protégé par la loi. On a évidemment le secret médical, le secret des délibérations du gouvernement, le secret des affaires et le droit à la vie privée. Donc concrètement, à part de très rares exceptions qui sont largement encadrées, les données qui sont mises à disposition sur des portails d’open data ne dévoilent pas d’informations sur des individus. Il y a un principe d’anonymisation et de non-réidentification qui fait qu’on ne doit pas pouvoir remonter à un individu à partir des données publiées.

Vous avez publié en janvier dernier aux éditions C&F l’ouvrage “Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs.”. Pourquoi avoir choisi Axelle Lemaire, ancienne secrétaire d’Etat chargée du Numérique et de l’Innovation, pour votre préface ?

Parce qu’elle est l’instigatrice de la loi pour une République numérique, on parle d’ailleurs souvent de la “loi Lemaire”. Cette loi, comme je l’ai dit, est un acte fort pour l’open data en instaurant ce principe d’ouverture des données par défaut. De plus, Axelle Lemaire est une fervente défenseuse de l’open data. J’ai senti dès le début de nos échanges que nos visions étaient assez alignées sur l’importance de l’open data pour la démocratie. Je trouve que ça se retrouve bien dans sa préface, où elle a fait un beau témoignage à la fois sur l’histoire de la loi, mais aussi sur tout le potentiel que continue d’avoir l’open data sept ans après la loi.

Vous tissez effectivement un lien entre l’ouverture des données et la participation citoyenne. L’open data pourrait-il contribuer à l’évaluation des politiques publiques par les citoyens eux-mêmes ?

Le lien entre open data et participation citoyenne m’est paru encore plus évident en travaillant au quotidien avec Magali Nonjon qui est spécialiste des sujets liés à la participation.

Mon constat, c’est que dans les politiques participatives, on a d’une part une administration qui arrive avec une ingénierie de la donnée, avec des cartes, des chiffres et des graphiques, censés objectiver les décisions qui sont prises, et en face, les citoyens qui viennent avec leurs propres mots et expériences.

Mais cela ne génère pas un rapport de force tout à fait égal : j’estime que l’accès aux données, dans leur plus grand niveau de précision que permet l’open data, pourrait être un levier important d’égalisation des rapports et permettrait un débat plus éclairé. Avec un accès aux données on peut proposer de nouvelles interprétations, refaire les calculs pour vérifier ce qui nous est dit, et aussi être en capacité de nuancer certains propos tenus par des décideurs et de les contester sur la base des données qui sont utilisées par l’administration.

Malheureusement, ce mariage entre open data et participation n’a pas encore eu lieu, et trop peu d’initiatives sont dénombrables.

Il a eu par exemple des ateliers de cartographie sur la troisième ligne du métro de Toulouse dans lesquels les citoyens se sont saisis des données pour produire des cartes et ça a permis de poser des questions sur son tracé. On peut aussi citer la convention citoyenne pour le climat où les citoyens ont été formés au sujet à travers un accès aux données et aux faits concernant le réchauffement climatique.

Donc, lorsqu’on se penche sur la participation citoyenne, la question plus large de la médiation des données finit par se poser inévitablement.

Autrefois s’organisait à Aix-en-Provence la Data Literacy Conference qui rassemblait des professionnels de ce domaine, voulant faire de la donnée une compétence essentielle comme lire, écrire ou compter !

Et je suis d’accord avec cela : les données ne doivent pas être réservées à une petite élite sinon quoi une politique d’open data sans médiation se transforme en un renforcement du pouvoir pour ceux qui l’ont déjà !

L’open data offre parfois des perspectives en matière de contre-expertise citoyenne, mais encore faut il développer les compétences techniques d’analyse des données dans la société civile directement ou en ralliant les professionnels de l’espace informationnel.

C’est ce qu’a fait un journaliste du Monde en publiant des données sur l’implantation des réseaux d’éducation prioritaire, chose que le ministère de l’Éducation ne voulait pas faire alors même que les données montraient une nécessaire redéfinition géographique des REP tant leurs indices de position sociale avaient évolué. Je pense que les médiathèques sont un potentiel intéressant dans la formation des citoyens à l’analyse des données.

Pour conclure, il y a donc un intérêt très fort à mettre en place des actions de médiation pour toucher un plus large public qu’il faut acculturer, et lutter contre le “jargon”, car il produit un sentiment d’illégitimité du public sur ces questions démocratiques.