Version bêta - ce site est en cours de déploiement. Certaines fonctionnalités peuvent ne pas fonctionner correctement. Merci pour votre compréhension.
Éclaireur Icon

La méthodologie ou
les dessous de l'outil Éclaireur Public

Comment réunir savoir-faire, technologies dernier cri et bonnes volontés pour la transparence des données publiques, revue de détails

Eclaireur Public a vocation à éclairer les citoyens sur les données publiques, et particulièrement sur les subventions et marchés publics des différentes strates composant les collectivités territoriales, à savoir communes, intercommunalités, agglomérations / métropoles, départements et régions.

Pour parvenir à ces fins, Transparency International France et Anticor ont rédigé de concert un document préparatoire intitulé « Eclaireur Public - Analyse de la transparence des collectivités locales » définissant les objectifs généraux et un cadre qui donne corps à l'objet « Eclaireur Public », site internet « permettant aux visiteurs de consulter des données à jour sur sa collectivité locale ».

Avec comme objectif sous-jacent, l'accompagnement des acteurs de ces collectivités et l'incitation à améliorer la transparence de ces structures.

Un pré-travail de défrichage des données (via un pipeline de scraping automatisé) avait été mis en place grâce à un script en langage Python pour récupérer les données spécifiquement sur data.gouv.fr. L'algorithme est disponible en open source à l'adresse suivante : github.com/m4xim1nus

Décision est prise fin 2024 par TIF et Anticor de faire appel au réseau de bénévolat Data For Good le bien nommé pour répondre aux attentes d'un projet d'ouverture des données d'envergure au service du bien public.

Fin février, le projet, parmi 11 autres, est présenté aux bénévoles sur la chaîne Youtube de Data For Good.

La collecte des données

En théorie, les données sur les subventions et les marchés publics sont toutes disponibles en « open data » sur le site dédié aux données censées être publiques data.gouv.fr.

En réalité, les données sont disséminées en de multiples endroits que seul-e-s des professionnels de la donnée numérique, des data engineers aux data analysts jusqu'aux data scientists, sans compter quelques nerds psychopathes des données de tout poil, sont capables de les exhumer.

À l'initialisation du projet (en avril 2025), 31 jeux de données ont été nécessaires pour mettre en place cet outil, Eclaireur Public, dont voici les principaux :

  • OFGL Régions
  • OFGL Départements
  • OFGL Communes
  • OFGL Intercommunalités
  • OFGL Départements

L'élaboration d'un indice de transparence des collectivités

Il est apparu évident, et nécessaire, dès le début que pour comparer les collectivités entre elles et pour mesurer leur degré d'ouverture des données publiques, il fallait construire un indice qui repose sur un certain nombre de critères objectifs. Le groupe de travail « barème de transparence », en étroite collaboration avec TIF et Anticor a finalement élaboré 3 indices de transparence, calqué sur une notation allant de A à E (comme le nutriscore) :

  • l'indice de transparence des subventions
  • l'indice de transparence des marchés publics
  • l'indice de transparence agrégé des 2 indices précédents

Calcul de l'indice de transparence des subventions

L'indice de transparence des marchés publics est établi selon la conjonction de 3 facteurs principaux :

  • la publication de données sur les marchés inférieurs à 40000 €
  • la publication de données sur les marchés supérieurs à 40000 €
  • la publication de données sur les 10 critères suivants :
Code CPV
Montant
Date de notification
Lieu d'exécution nom
Forme de prix
Objet
Nature
Durée en mois
Procédure
Titulaire

La grille ci-dessous établit les notes de transparence, de A à E. Plus la collectivité remplit les critères, meilleure est sa note.

Barème de transparence des marchés publics

A
B
C
D
E
A

Données communiquées, avec des montants supérieurs ou inférieurs à 40 000 euros, les 10 points de données sont alimentés et la date de publication est en moyenne inférieure à 2 mois à compter de la date de notification.

B

Données communiquées avec des montants supérieurs ou obligatoires à 40 000 et les 10 données ci-dessous sont alimentées : code CPV, montant, date de notification, lieu exécution, lieu d’exécution nom, forme de prix, objet, nature, durée en mois, procédure, titulaire.

C

Communiquées avec des montants supérieurs ou inférieurs à 40 000 euros.

D

Données communiquées avec des montants supérieurs à 40 000

E

Données non communiquées.

Calcul de l’indice de transparence des subventions

Pour une année N, l'indice de transparence des subventions d'une collectivité se calcule comme suit : Somme des subventions détaillées divisée par somme totale des subventions indiquée dans le budget du compte administratif. La grille ci-dessous établit les notes de transparence, de A à E, en fonction du taux de publication, la valeur A étant la note maximale avec un taux de publication de 100 %, et la valeur E la note la plus basse avec un taux de publication inférieur

La grille ci-dessous établit les notes de transparence, de A à E. Plus la collectivité remplit les critères, meilleure est sa note.

Variable : taux de publication (en valeur) = somme Subventions Détaillées / Budget Compte Administratif

A
B
C
D
E
A
100% (+/- 5%)
B
De 75% à 95%
C
De 50% à 75%
D
De 25% à 50%
E
Moins de 25% ou données inexploitablesSi plus de 105% → E

Calcul de l'indice de transparence globale - Score Agrégé

L'indice de transparence globale, pour une année N, est la moyenne des indice des subventions et indice des marchés publics, arrondi à l'échelon supérieur en cas de virgule.

A
B
C
D
E

L'organisation du projet

L'ingénierie de données

Nous avons développé des scripts et automatisations pour collecter, nettoyer et structurer les données issues de différentes sources (data.gouv.fr , sites institutionnels, etc.). Ce travail de fond a permis de transformer des fichiers parfois bruts ou hétérogènes en bases de données cohérentes, exploitables et comparables entre collectivités.

L'architecture d'information et l'expérience utilisateur

Notre démarche s'appuie sur des principes agiles et centrés sur l'utilisateur, tout en adoptant une approche transparente, collaborative et progressive, dans le but de rendre accessibles à tous les citoyens les données publiques essentielles liées à la gestion des collectivités locales.

Personas et Identification des utilisateurs

Nous avons créé des personas basés sur les différents profils d'utilisateurs (citoyens, élus, chercheurs, journalistes) afin de comprendre leurs attentes et leurs parcours. Cette étape nous a permis de mieux définir les fonctionnalités et d'orienter le design de manière pertinente.

User Flow, Arborescence et Wireframing

À partir des User Flows et de l'arborescence du site, nous avons conçu des wireframes (maquette basse fidélité) pour tester les interactions et le parcours utilisateur de manière simple et intuitive. Cela a permis de valider les principales interactions avant de passer à la conception visuelle détaillée (maquette haute définition) à partir de la charte graphique élaborer par l'équipe design

Conception de la recherche et de la comparaison

Nous avons conçu des outils de recherche avancée et de comparaison des collectivités, afin de permettre aux utilisateurs de filtrer et analyser les données en fonction de critères spécifiques (population, budget, score de transparence).

Mise en Production et Suivi

Le lancement de la version MVP permettra de tester l'outil en conditions réelles, avec une attention particulière portée aux retours des utilisateurs pour des améliorations continues. Cela nous permet de garantir une expérience fluide et intuitive, tout en restant flexible pour apporter des améliorations continues à la plateforme Éclaireur Public.

L'analyse des données

Une fois les données structurées, nous les avons analysées afin de créer des indicateurs de transparence clairs et pertinents. Cette étape a consisté à définir les critères de calcul des indices (par exemple : délais de publication, exhaustivité des informations, cohérence des formats), puis à automatiser le traitement pour obtenir des résultats fiables et reproductibles.

Design Thinking

Nous avons appliqué la méthodologie Design Thinking pour comprendre en profondeur les besoins des utilisateurs. Cela a permis de définir des solutions innovantes en prenant en compte l'expérience utilisateur, l'accessibilité des données publiques et l'engagement des citoyens.

Story Mapping

En utilisant la technique de Story Mapping, nous avons découpé les fonctionnalités en thématique et user stories pour prioriser les éléments clés à développer. Cela a facilité la gestion de notre backlog et permis de structurer les sprints de développement pour répondre au mieux aux besoins des utilisateurs.

Prototypage et Développement Agile

Le prototypage a évolué en designs haute fidélité. Nous avons opté pour une approche agile et itérative, permettant des ajustements réguliers et une prise en compte des retours (association et membre du projet) à chaque étape du projet. Le développement a avancé parallèlement à la création des maquettes. Chaque fonctionnalité a été intégrée au fur et à mesure, avec un focus sur les sections principales (consultation des données, interpellation des élus, etc.).

Tests Utilisateurs et Itérations

Bien que les tests utilisateurs formels aient été limités, nous avons procédé à des tests informels au fil de l'avancement pour ajuster l'interface en fonction des retours internes.

Le développement

Côté technique, nous avons conçu et mis en place la plateforme web permettant de restituer ces données de manière lisible et accessible à toutes et tous. Le développement s’est appuyé sur une approche agile : incrémenter les fonctionnalités au fil des sprints, tester régulièrement et intégrer les retours des utilisateurs. Cela garantit un outil robuste mais aussi évolutif, capable de s’enrichir en continu.