Dans cette section, vous apprendrez comment :
Un score de qualité des métadonnées a été mis en place sur data.gouv.fr pour répondre principalement à deux problématiques :
Les réutilisateurs de données peinent à identifier les jeux de données de qualité et à évaluer si tel ou tel jeu de donnée est digne d’intérêt ;
Les producteurs de données ne sont pas suffisamment incités et accompagnés à améliorer la qualité de leurs données.
Grâce à ce score de qualité des métadonnées, il est possible d'identifier les axes sur lesquels travailler pour améliorer la qualité de vos données.
🧭 Les critères sont les suivants :
Ce score est encore en phase d’expérimentation :
De nouveaux critères seront ajoutés progressivement notamment pour intégrer la notion de schéma de données.
Le poids de chaque critère sera ajusté en fonction de ;
Description des données
La description des données est de qualité (la description du jeu de données suffisamment longue).
Ressources documentées
Présence d'au moins un fichier de type documentation ou description des fichiers suffisamment longue.
Mise à jour
- La fréquence de mise à jour est renseignée. - La fréquence de mise à jour est respectée.
Licence
- La licence est renseignée. - La licence est ouverte. Voir la page licence pour plus d’information.
Métadonnées des ressources
Présence d’au moins une ressource avec un format ouvert déclaré.
Couverture spatiale
- La couverture spatiale est renseignée. - La granularité spatiale est renseignée.
Couverture temporelle
La couverture temporelle des données est renseignée.
Pour être en capacité d'améliorer la qualité des données en continu, il convient d'adapter sa stratégie organisationnelle. Il est notamment conseillé de :
Identifier une personne coordinatrice de la démarche d'ouverture des données : elle a pour mission de publier les jeux de données, de s'assurer que leurs mises à jour sont effectuées et d'animer la vie des jeux de données sur la plateforme (répondre aux commentaires, etc.). La personne coordinatrice travaille en lien direct avec les équipes métiers afin de comprendre les problématiques techniques.
Elaborer un processus de rétroaction : lors de l'exploitation des jeux de données, les réutilisateurs peuvent identifier des anomalies ou des problèmes de qualité ou encore proposer des améliorations. Il est nécessaire d'instaurer un canal de rétroaction afin d'intégrer ces remarques dans les processus métiers et ainsi améliorer la qualité des jeux de données.
Bien souvent, la qualité de données que vous proposez, bien qu'adaptée aux utilisations internes à votre structure, peut être améliorée pour les usages nouveaux engendrés par l'ouverture, qu'il s'agit alors de mieux connaître.
Lexique : Réutilisation
Une réutilisation désigne communément l’exploitation de données ouvertes par des tiers, à d’autres fins que celle de la mission de service public pour laquelle elles ont été produites ou reçues.
Elle peut prendre la forme d’une visualisation, d’une application, d’un article de presse, d’un papier de recherche, etc.
Il est possible de combiner approches quantitatives et qualitatives pour cerner les usages d'un jeu de données.
Selon les moyens disponibles, plusieurs leviers sont disponibles :
Mesurer les volumes d'usage : en suivant les métriques des jeux de données publiés proposés par data.gouv.fr ou sur son propre portail (nombre de consultations, nombre de téléchargements, nombre de réutilisations, etc.).
Répondre aux commentaires et aux questions soumis sur data.gouv.fr, dans lesquels les réutilisateurs font régulièrement remonter leurs besoins. D'après l'analyse réalisée par des étudiantes et des étudiants de l'Université Bordeaux Montaigne, sur data.gouv.fr, de nombreux commentaires peuvent être catégorisés comme relevant de problématiques d'accessibilité, suivie de celles d'actualisation des données puis des questions de fiabilité et d'exploitabilité des données.
Suivre les réutilisations ajoutées sur ses jeux de données sur data.gouv.fr et inciter au référencement.
Réaliser des enquêtes auprès des réutilisateurs.
Exemples :
A l'automne 2021, les producteurs de la Base Sirene (INSEE) ont sondé leurs réutilisateurs sur des questions de contenu, de format ou encore de documentation des données.
En décembre 2022, le ministère de la Culture a lancé une consultation publique sur l'ouverture des données publiques culturelles. Cette consultation visait à recueillir les besoins et les remarques des usagers concernant les jeux de données déjà ouverts et ceux qui auraient vocation à être ouverts.
Animer des communautés de réutilisateurs, notamment en organisant régulièrement des ateliers de discussions entre producteurs et réutilisateurs ou en proposant un espace d'échange en ligne.
Exemple :
L'Institut National de l'Information Géographique et Forestière (IGN) organise un certain nombre d'événements mettant à l'honneur les réutilisateurs. Il propose également des conférences, des webinaires de prise en main des différents services ainsi que des tutoriels d'accompagnement.
Réaliser des entretiens avec les principaux réutilisateurs.
Exemple
Pôle Emploi travaille étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.