LogoLogo
✉️ Contact💬 Forum
Guides de data.gouv.fr
Guides de data.gouv.fr
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de data.gouv.fr
    • Créer un compte utilisateur et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Certifier une organisation
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
        • Publier une Base Adresse Locale
      • Gérer un jeu de données
      • Explorer un jeu de donnée
      • Télécharger le catalogue de données de data.gouv.fr
      • Accéder au catalogue via SPARQL
    • API
      • Publier une API
      • Gérer une API
      • Outils pour les administrations
        • Doctrine des API
        • Accompagnement humain
        • Datapass : Outil d'habilitations
        • Bouquets API Entreprise et API Particulier
    • Réutilisations
      • Publier une réutilisation
      • Gérer une réutilisation
    • Statistiques
    • Ressource communautaire
    • Moissonnage
      • Comprendre les limites du moissonnage
      • Les différents types de moissonneurs
      • Mettre en place un moissonneur
      • Analyser le rapport de moissonnage
      • Moissonnage des plateformes géographiques
    • API de data.gouv.fr
      • Prise en main de l'API
      • Tutoriel d'utilisation
      • Gérer un jeu de données par l'API
      • Référence
        • site
        • datasets
        • reuses
        • discussions
        • organizations
        • spatial
        • users
        • me
        • contacts
        • workers
        • tags
        • topics
        • posts
        • transfer
        • notifications
        • avatars
        • harvest
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Guides sur l'utilisation des données
    • Introduction à l'open data
      • Comprendre la notion d'open data
      • Comprendre l'écosystème de l'open data
      • Comprendre les conditions d'utilisation des données en open data
      • Découvrir et utiliser data.gouv.fr
    • Guide traitement et analyse de données
      • Trouver des données
      • Prendre connaissance et évaluer la qualité de données
      • Explorer des données
      • Récupérer des données
      • Manipuler des données
        • Ouvrir des données
        • Filtrer des données
        • Nettoyer des données
        • Croiser des données
        • Géocoder des adresses
      • Analyser des données
        • Analyser des données avec le tableur LibreOffice Calc
        • Analyser des données avec Python
        • Analyser des données avec R
      • Visualiser des données
      • Cartographier des données
      • Réaliser des projets utiles et s'inspirer
      • Poser des questions aux producteurs de données
      • Valoriser ses travaux
      • Autres ressources pédagogiques
    • Guide API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Guide données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Guide données météorologiques
    • Guide API "Adresse" de l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
    • Les algorithmes publics : pourquoi et comment les expliquer ?
      • Les algorithmes publics : enjeux et obligations
      • Fiche pratique : l'obligation de mention explicite
      • Fiche pratique : l'inventaire des principaux traitements algorithmiques
      • Liste de ressources
    • Codes sources du secteur public : lesquels ouvrir, pourquoi et comment ?
      • Ce document n'est pas...
      • Cadre juridique
    • Catalogage de données - GRIST
    • 📒Guide du participant au Hackathon Météo
      • Ressources du hackathon
        • Données
        • Prise en main des données
        • Outils
        • Programme
        • Informations pratiques
        • Contacts
      • Avant le hackathon
      • Pendant le hackathon : règles et bonnes pratiques
        • Choix du défi
        • Constitution des équipes
        • Sollicitation des mentors
        • Documentation des réalisations
        • Rendu intermédiaire
        • Soumission du projet
        • Evaluation des projets
      • Après le hackathon
        • Evaluation du hackathon
        • Valorisation de votre projet
Propulsé par GitBook
Sur cette page
  • S’informer sur un jeu de données grâce aux métadonnées et à la documentation
  • Consulter les métadonnées
  • Consulter la documentation
  • Evaluer le contenu d’un jeu de données par la prévisualisation
  • Consulter les retours des autres réutilisateurs dans les discussions
  • Evaluer l’intérêt d’un jeu de données par sa popularité
  • Ressources externes pour aller plus loin

Cet article vous a-t-il été utile ?

Modifier sur GitHub
Exporter en PDF
  1. Guides sur l'utilisation des données
  2. Guide traitement et analyse de données

Prendre connaissance et évaluer la qualité de données

PrécédentTrouver des donnéesSuivantExplorer des données

Dernière mise à jour il y a 8 mois

Cet article vous a-t-il été utile ?

Vous avez trouvé le jeu de données qui vous intéresse (cf. "") et souhaitez confirmer qu’il correspond bien à votre besoin.

Pour cela, il est possible d'utiliser les méthodes suivantes :

S’informer sur un jeu de données grâce aux métadonnées et à la documentation

Consulter les métadonnées

Métadonnée : Donnée qui décrit ou définit une autre donnée.

Les métadonnées fournissent les renseignements de base sur les données, le contexte qui permet de comprendre leur nature et ce qu’elles couvrent.

  • Titre

  • Sigle

  • Description

  • Licence

  • Fréquence de mise à jour

  • Mots clés

  • Couverture temporelle

  • Couverture spatiale

  • Granularité spatiale

Grâce aux métadonnées, vous pouvez par exemple savoir et vérifier :

  • dans la description principale ;

  • dans l’onglet “Informations”.

Consulter la documentation

Les producteurs de données sont encouragés à associer une documentation aux jeux de données qu’ils publient en open data.

La documentation d’un jeu de données décrit les données et la structure des fichiers publiés (par exemple la description des colonnes, la méthode de production des données, etc.). Elle a une visée pédagogique et facilite la réutilisation.

Evaluer le contenu d’un jeu de données par la prévisualisation

Pour se faire une idée du contenu, de la complétude et de la qualité d’un jeu de données avant de l’exploiter, il est possible de le prévisualiser.

La prévisualisation permet :

  • d’avoir un aperçu des données ;

  • d’examiner les attributs des données (colonnes, etc.) ;

  • d’identifier les limites et les manques.

Exemple : - Si vous avez besoin de données couvrant une période particulière, vous pouvez vérifier que les données sur la période sont disponibles. - Vous pouvez vérifier que les données que vous vous attendiez à trouver dans le fichier y figurent, et que vous comprenez bien les différents libellés.

Cette fonctionnalité n’est pas disponible pour tous les jeux de données. Elle n’est disponible que pour les jeux de données tabulaires de 100 Mo maximum.

  1. Prévisualiser directement le fichier sur la page du jeu de données. Pour cela :

  • Rendez-vous sur la page du jeu de données ;

  • Identifiez le fichier que vous souhaitez prévisualiser ;

  • Cliquez dessus ;

  • Vous aurez alors accès à la prévisualisation. Vous pouvez visualiser les cinq premières lignes du fichier (avec la possibilité de trier) ;

  • Vous pouvez également accéder à des informations sur la structure des données dans l’onglet “Structure des données”.

  • Rendez-vous sur la page du jeu de données ;

  • Identifiez le fichier que vous souhaitez prévisualiser ;

  • Cliquez dessus ;

  • Cliquez sur “Explorer les données” ;

Consulter les retours des autres réutilisateurs dans les discussions

  • leur poser des questions sur les données ;

  • faire des retours sur la qualité des données.

Evaluer l’intérêt d’un jeu de données par sa popularité

Pour identifier les bons jeux de données, et notamment ceux qui font référence sur un sujet spécifique, la dimension communautaire peut s’avérer importante. Pour sonder la popularité d’un jeu de données, vous pouvez en consulter l’activité.

Ressources externes pour aller plus loin

  • D’autres outils pour prévisualiser des données tabulaires :

Sur , les principales métadonnées disponibles pour les jeux de données sont les suivantes :

Sur , les métadonnées sont disponibles sur la page du jeu de données :

Pour identifier plus facilement les jeux de données de qualité sur , il est possible de se référer au score de qualité des métadonnées. Pour chaque jeu de données, il évalue le remplissage de plusieurs métadonnées (description des données, mise à jour, licence, métadonnées des ressources, couverture spatiale et couverture temporelle) et donne ainsi une première indication sur la qualité des données.

Sur , la documentation est mise à disposition dans l’onglet “Fichiers”, dans la catégorie “Documentation”.

Sur , 2 options sont à votre disposition pour prévisualiser les données tabulaires :

Prévisualiser le fichier sur

Vous atterrissez sur l’explorateur de données développé par l’équipe de .

Sur , les réutilisateurs peuvent échanger avec les producteurs de données pour notamment :

Ces questions et retours peuvent donner des indications sur la qualité des données et les limites déjà identifiées. Sur , vous pouvez les consulter dans l’onglet “Discussions” du jeu de données.

Il est possible que d’autres réutilisateurs de données aient déjà identifié des problèmes de qualité sur les données, décidé de les retraiter et de publier leurs travaux sur . Vous pouvez alors retrouver ces données retravaillées dans l’onglet “Ressources communautaires” du jeu de données.

Sur , ces statistiques sont disponibles sur les pages de jeu de données, dans l’onglet “Informations” dans la catégorie “Statistiques des 12 derniers mois”. .

: permet de téléverser un fichier pour prendre connaissance de ses colonnes et valeurs

: permet de prendre connaissance du contenu des données.

data.gouv.fr
data.gouv.fr
data.gouv.fr
data.gouv.fr
data.gouv.fr
explore.data.gouv.fr
data.gouv.fr
data.gouv.fr
data.gouv.fr
data.gouv.fr
data.gouv.fr
Pour en savoir plus
Cours Open Data : Accès au terrain et repérages - Cerema Med (Mathieu Rajerison)
CSV Lint
WTFcsv
Trouver des données
Trouver les métadonnées d'un jeu de données sur data.gouv.fr
Trouver la documentation d'un jeu de données sur data.gouv.fr
Prévisualiser un jeu de données directement sur la page du jeu de données
Prévisualiser un jeu de données sur explore.data.gouv.fr
Accéder aux discussions d'un jeu de données sur data.gouv.fr
Consulter les statistiques des jeux de données sur data.gouv.fr