Evaluer le niveau de qualité d'un jeu de données
Définir la qualité d'un jeu de données
Pour une donnée, la notion de qualité dépend grandement de l'usage qui en est fait.
Les jeux de données publiés sont généralement produits dans un contexte propre à un processus métier et pour un usage particulier. Cet environnement métier n'est pas toujours familier aux tiers, qu'ils soient internes ou externes à l'organisation.
Exemple : La base de données des demandes de valeur foncière est historiquement produite par la Direction générale des finances publiques pour tenir un fichier immobilier et collecter l'impôt.
Les réutilisateurs peuvent alors rencontrer des difficultés lorsqu'ils souhaitent s'approprier des données ouvertes :
Difficultés dans la compréhension de la structure du jeu de données ;
Difficultés dans la compréhension des données elles-mêmes ;
Qualité non adaptée aux usages voulus (mise à jour, documentation insuffisante ou inexacte, etc.).
Il est donc indispensable de prendre en compte les pratiques des réutilisateurs en amont de la production des jeux de données.
Evaluer le niveau de qualité d'un jeu de données
Plusieurs critères permettent d'évaluer le niveau de qualité d'un jeu de données, notamment :
Dernière mise à jour