Prendre connaissance et évaluer la qualité de données
Dernière mise à jour
Cet article vous a-t-il été utile ?
Dernière mise à jour
Cet article vous a-t-il été utile ?
Vous avez trouvé le jeu de données qui vous intéresse (cf. "") et souhaitez confirmer qu’il correspond bien à votre besoin.
Pour cela, il est possible d'utiliser les méthodes suivantes :
Les métadonnées fournissent les renseignements de base sur les données, le contexte qui permet de comprendre leur nature et ce qu’elles couvrent.
Titre
Sigle
Description
Licence
Fréquence de mise à jour
Mots clés
Couverture temporelle
Couverture spatiale
Granularité spatiale
Grâce aux métadonnées, vous pouvez par exemple savoir et vérifier :
dans la description principale ;
dans l’onglet “Informations”.
Les producteurs de données sont encouragés à associer une documentation aux jeux de données qu’ils publient en open data.
La documentation d’un jeu de données décrit les données et la structure des fichiers publiés (par exemple la description des colonnes, la méthode de production des données, etc.). Elle a une visée pédagogique et facilite la réutilisation.
Pour se faire une idée du contenu, de la complétude et de la qualité d’un jeu de données avant de l’exploiter, il est possible de le prévisualiser.
La prévisualisation permet :
d’avoir un aperçu des données ;
d’examiner les attributs des données (colonnes, etc.) ;
d’identifier les limites et les manques.
Exemple : - Si vous avez besoin de données couvrant une période particulière, vous pouvez vérifier que les données sur la période sont disponibles. - Vous pouvez vérifier que les données que vous vous attendiez à trouver dans le fichier y figurent, et que vous comprenez bien les différents libellés.
Cette fonctionnalité n’est pas disponible pour tous les jeux de données. Elle n’est disponible que pour les jeux de données tabulaires de 100 Mo maximum.
Prévisualiser directement le fichier sur la page du jeu de données. Pour cela :
Rendez-vous sur la page du jeu de données ;
Identifiez le fichier que vous souhaitez prévisualiser ;
Cliquez dessus ;
Vous aurez alors accès à la prévisualisation. Vous pouvez visualiser les cinq premières lignes du fichier (avec la possibilité de trier) ;
Vous pouvez également accéder à des informations sur la structure des données dans l’onglet “Structure des données”.
Rendez-vous sur la page du jeu de données ;
Identifiez le fichier que vous souhaitez prévisualiser ;
Cliquez dessus ;
Cliquez sur “Explorer les données” ;
leur poser des questions sur les données ;
faire des retours sur la qualité des données.
Pour identifier les bons jeux de données, et notamment ceux qui font référence sur un sujet spécifique, la dimension communautaire peut s’avérer importante. Pour sonder la popularité d’un jeu de données, vous pouvez en consulter l’activité.
D’autres outils pour prévisualiser des données tabulaires :
Sur , les principales métadonnées disponibles pour les jeux de données sont les suivantes :
Sur , les métadonnées sont disponibles sur la page du jeu de données :
Pour identifier plus facilement les jeux de données de qualité sur , il est possible de se référer au score de qualité des métadonnées. Pour chaque jeu de données, il évalue le remplissage de plusieurs métadonnées (description des données, mise à jour, licence, métadonnées des ressources, couverture spatiale et couverture temporelle) et donne ainsi une première indication sur la qualité des données.
Sur , la documentation est mise à disposition dans l’onglet “Fichiers”, dans la catégorie “Documentation”.
Sur , 2 options sont à votre disposition pour prévisualiser les données tabulaires :
Prévisualiser le fichier sur
Vous atterrissez sur l’explorateur de données développé par l’équipe de .
Sur , les réutilisateurs peuvent échanger avec les producteurs de données pour notamment :
Ces questions et retours peuvent donner des indications sur la qualité des données et les limites déjà identifiées. Sur , vous pouvez les consulter dans l’onglet “Discussions” du jeu de données.
Il est possible que d’autres réutilisateurs de données aient déjà identifié des problèmes de qualité sur les données, décidé de les retraiter et de publier leurs travaux sur . Vous pouvez alors retrouver ces données retravaillées dans l’onglet “Ressources communautaires” du jeu de données.
Sur , ces statistiques sont disponibles sur les pages de jeu de données, dans l’onglet “Informations” dans la catégorie “Statistiques des 12 derniers mois”. .
: permet de téléverser un fichier pour prendre connaissance de ses colonnes et valeurs
: permet de prendre connaissance du contenu des données.