Publier des centaines de jeux de données sur un portail, c’est facile. Prouver qu’ils servent à quelque chose, c’est le vrai défi. Trop de portails open data sont des cimetières de fichiers. Pour justifier leur existence et améliorer l’offre, il faut passer de la simple publication à la mesure d’impact. Cela signifie connecter les métriques d’usage (téléchargements, appels API) à des résultats concrets: un service amélioré pour les citoyens, un coût évité pour l’administration, une innovation pour une entreprise.
prérequis
- Logs d’usage: Avoir accès aux statistiques brutes de consultation, de téléchargement et d’appels API de votre portail.
- Objectifs clairs: Avoir défini pour vos jeux de données prioritaires à quel type de problème ils sont censés répondre.
- Canal de feedback: Mettre en place un moyen simple pour que les réutilisateurs puissent déclarer ce qu’ils ont construit (formulaire, email, forum).
aperçu rapide
- Indicateurs d’usage: Suivre les téléchargements et appels API par jeu de données comme premier signal d’intérêt.
- Réutilisations documentées: Collecter et qualifier activement les cas d’usage concrets (qui, quoi, quel impact). C’est la preuve de la valeur.
- Tableau de bord d’impact: Communiquer de manière transparente sur les réussites et la santé du programme open data.
- Garanties de service (SLO): Définir des objectifs de fraîcheur et de qualité pour les jeux de données critiques afin de maintenir la confiance.
- Gestion de portefeuille: Archiver ou fusionner les jeux de données qui ne montrent aucun signe d’usage ou de pertinence après une certaine période. La qualité prime sur la quantité.
tutoriel pas-à-pas
étape 1: Tracer l’usage quantitatif
C’est la base. Mettez en place des requêtes pour suivre l’évolution de l’intérêt pour vos données. Cela ne mesure pas l’impact, mais permet de détecter les signaux d’activité.
-- Requête pour suivre le nombre de téléchargements uniques par semaine pour chaque dataset
-- Un 'user_hash' est un identifiant anonymisé de l'utilisateur (IP hashée, etc.)
SELECT
dataset_id,
DATE_TRUNC('week', download_timestamp)::date AS semaine,
COUNT(DISTINCT user_hash) AS telechargements_uniques
FROM
logs.portal_downloads
WHERE
download_timestamp >= CURRENT_DATE - INTERVAL '6 month'
GROUP BY 1, 2
ORDER BY 1, 2 DESC;
étape 2: Qualifier les réutilisations (la preuve)
C’est l’étape la plus importante. Il faut activement rechercher, contacter et documenter les réutilisateurs pour comprendre la valeur qu’ils créent. Mettez en place une “fiche de réutilisation” simple.
---
# Fiche de Réutilisation
reuse_id: "app-transport-paris-2021"
submitter_name: "Startup Mobilité Urbaine"
submitter_type: "Entreprise"
country: "France"
# Description du produit/service créé
product_description: "Application mobile qui optimise les trajets en transport en commun en combinant les horaires temps réel et les données de travaux."
# Données utilisées
datasets_used:
- id: "horaires-temps-reel-ratp"
version: "v2.1"
- id: "info-trafic-voirie-paris"
version: "v1.5"
# Impact qualitatif et quantitatif
impact_statement: "L'application fait gagner en moyenne 10 minutes par trajet à nos 50,000 utilisateurs quotidiens. L'accès fiable à ces données nous a évité 6 mois de développement pour collecter l'information nous-mêmes."
# Preuve (lien, capture d'écran)
proof_url: "[https://lien-vers-app-store.com/app-transport-paris](https://lien-vers-app-store.com/app-transport-paris)"
---
étape 3: Publier un tableau de bord d’impact
Rendez vos résultats visibles et lisibles par tous (élus, management, citoyens). Un tableau de bord public renforce la transparence et justifie l’investissement.
### Tableau de Bord de l'Impact - Mars 2021
- **Datasets Prioritaires Actifs**: 45 / 50 (90%)
- **Nouvelles Réutilisations Publiées**: 3
- *Application mobile 'EcoScore' (secteur privé)*
- *Dashboard de suivi COVID (recherche académique)*
- *Carte des bornes de recharge (initiative citoyenne)*
- **Incidents Qualité Résolus en < 7 jours**: 95%
- **Satisfaction des Réutilisateurs (NPS)**: +42
exemples
cas: Dashboard de santé des données prioritaires
Cette requête simple permet de lister vos jeux de données les plus importants et de voir s’ils sont utilisés, pour concentrer vos efforts de maintenance et de promotion.
WITH monthly_usage AS (
SELECT
dataset_id,
COUNT(DISTINCT user_hash) AS unique_downloads_30d
FROM
logs.portal_downloads
WHERE
download_timestamp >= CURRENT_DATE - INTERVAL '30 day'
GROUP BY 1
)
SELECT
d.dataset_name,
d.owner_department,
d.last_update_date,
COALESCE(u.unique_downloads_30d, 0) AS downloads_30j
FROM
catalog.datasets d
LEFT JOIN
monthly_usage u ON d.dataset_id = u.dataset_id
WHERE
d.is_priority = true
ORDER BY
downloads_30j DESC;
pièges fréquents
-
Symptôme: Se vanter du nombre de téléchargements.
- Cause: Se concentrer sur les “vanity metrics” faciles à obtenir.
- Correctif: Fixer un objectif de documenter 3 à 5 preuves de valeur (fiches de réutilisation) par trimestre. Une seule bonne fiche vaut mieux que 10,000 téléchargements anonymes.
-
Symptôme: Un portail avec des milliers de jeux de données, la plupart obsolètes.
- Cause: Le “syndrome du collectionneur”, où la quantité prime sur la qualité.
- Correctif: Mettre en place une politique d’archivage. Si un jeu de données n’a aucun téléchargement et aucune réutilisation déclarée en 12 mois, il doit être archivé ou fusionné.
-
Symptôme: Les réutilisateurs se plaignent que les données ne sont pas à jour.
- Cause: Pas d’engagement sur la fraîcheur des données.
- Correctif: Définir et afficher un Service Level Objective (SLO) de fraîcheur pour chaque jeu de données critique (ex: “mis à jour toutes les 24h”) et mettre en place des alertes quand il n’est pas respecté.
-
Symptôme: Les gens téléchargent les données mais posent beaucoup de questions basiques.
- Cause: Une documentation pauvre ou inexistante.
- Correctif: Chaque jeu de données doit avoir une fiche descriptive minimale : dictionnaire des champs, un exemple de quelques lignes, et le contact du “steward”.
faq
-
Comment inciter les gens à déclarer leurs réutilisations ? Rendez le processus le plus simple possible (un formulaire en 2 minutes). Mettez en avant les réutilisateurs sur votre portail ou votre newsletter : c’est de la visibilité gratuite pour eux. Organisez des challenges ou des hackathons avec des prix pour stimuler la création.
-
L’impact doit-il toujours être économique ? Absolument pas. L’impact de l’open data peut être social (améliorer la vie des citoyens), démocratique (augmenter la transparence de l’action publique), environnemental (aider à la transition écologique) ou de recherche. Il est crucial de mesurer toutes ces facettes.