LogoLogo
✉️ Contact💬 Forum
Guides de data.gouv.fr
Guides de data.gouv.fr
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de data.gouv.fr
    • Créer un compte utilisateur et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Certifier une organisation
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
        • Publier une Base Adresse Locale
      • Gérer un jeu de données
      • Explorer un jeu de donnée
      • Télécharger le catalogue de données de data.gouv.fr
      • Accéder au catalogue via SPARQL
    • API
      • Publier une API
      • Gérer une API
      • Outils pour les administrations
        • Doctrine des API
        • Accompagnement humain
        • Datapass : Outil d'habilitations
        • Bouquets API Entreprise et API Particulier
    • Réutilisations
      • Publier une réutilisation
      • Gérer une réutilisation
    • Statistiques
    • Ressource communautaire
    • Moissonnage
      • Comprendre les limites du moissonnage
      • Les différents types de moissonneurs
      • Mettre en place un moissonneur
      • Analyser le rapport de moissonnage
      • Moissonnage des plateformes géographiques
    • API de data.gouv.fr
      • Prise en main de l'API
      • Tutoriel d'utilisation
      • Gérer un jeu de données par l'API
      • Référence
        • site
        • datasets
        • reuses
        • discussions
        • organizations
        • spatial
        • users
        • me
        • contacts
        • workers
        • tags
        • topics
        • posts
        • transfer
        • notifications
        • avatars
        • harvest
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Guides sur l'utilisation des données
    • Introduction à l'open data
      • Comprendre la notion d'open data
      • Comprendre l'écosystème de l'open data
      • Comprendre les conditions d'utilisation des données en open data
      • Découvrir et utiliser data.gouv.fr
    • Guide traitement et analyse de données
      • Trouver des données
      • Prendre connaissance et évaluer la qualité de données
      • Explorer des données
      • Récupérer des données
      • Manipuler des données
        • Ouvrir des données
        • Filtrer des données
        • Nettoyer des données
        • Croiser des données
        • Géocoder des adresses
      • Analyser des données
        • Analyser des données avec le tableur LibreOffice Calc
        • Analyser des données avec Python
        • Analyser des données avec R
      • Visualiser des données
      • Cartographier des données
      • Réaliser des projets utiles et s'inspirer
      • Poser des questions aux producteurs de données
      • Valoriser ses travaux
      • Autres ressources pédagogiques
    • Guide API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Guide données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Guide données météorologiques
    • Guide API "Adresse" de l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
    • Les algorithmes publics : pourquoi et comment les expliquer ?
      • Les algorithmes publics : enjeux et obligations
      • Fiche pratique : l'obligation de mention explicite
      • Fiche pratique : l'inventaire des principaux traitements algorithmiques
      • Liste de ressources
    • Codes sources du secteur public : lesquels ouvrir, pourquoi et comment ?
      • Ce document n'est pas...
      • Cadre juridique
    • Catalogage de données - GRIST
    • 📒Guide du participant au Hackathon Météo
      • Ressources du hackathon
        • Données
        • Prise en main des données
        • Outils
        • Programme
        • Informations pratiques
        • Contacts
      • Avant le hackathon
      • Pendant le hackathon : règles et bonnes pratiques
        • Choix du défi
        • Constitution des équipes
        • Sollicitation des mentors
        • Documentation des réalisations
        • Rendu intermédiaire
        • Soumission du projet
        • Evaluation des projets
      • Après le hackathon
        • Evaluation du hackathon
        • Valorisation de votre projet
Propulsé par GitBook
Sur cette page
  • Liste de variables pivots communes
  • Exemple : Croiser deux jeux de données avec le logiciel de tableur LibreOffice Calc
  • Données d’exemple
  • La fonction RECHERCHEV
  • Tutoriel

Cet article vous a-t-il été utile ?

Modifier sur GitHub
Exporter en PDF
  1. Guides sur l'utilisation des données
  2. Guide traitement et analyse de données
  3. Manipuler des données

Croiser des données

PrécédentNettoyer des donnéesSuivantGéocoder des adresses

Dernière mise à jour il y a 8 mois

Cet article vous a-t-il été utile ?

Dans le cadre de vos travaux, il peut s’avérer intéressant de croiser plusieurs jeux de données entre eux, et ainsi créer des jeux de données enrichis.

Le croisement de données consiste à joindre des jeux de données distincts en utilisant un attribut commun.

Liste de variables pivots communes

Voici une liste non exhaustive de variables pivots qu’il est possible d’utiliser pour croiser des données.

Variable pivot
Description
Jeu de données référentiel associé

SIREN, SIRET

Identifiant des entreprises françaises et de leurs établissements

BAN

Adresses du territoire français

Code Officiel Géographique

Codes et libellés des communes, des cantons, des arrondissements, des départements, des régions et des pays et territoires étrangers

Plan Cadastral Informatisé

Identifiant des parcelles cadastrales

N°RNA

Identifiant des associations françaises

Code ROME

Identifiant des métiers et des emplois

Code NAF

Nomenclature des activités économiques productives

N°RNCP/N°RS

Identifiant des certifications professionnelles

N°Fantoir

Identifiant des lieux-dits et des voies pour chaque commune

Pour en savoir plus, nous vous invitons à consulter la section “” du guide qualité.

Exemple : Croiser deux jeux de données avec le logiciel de tableur LibreOffice Calc

Données d’exemple

Jeu de données 1 : Données de produits

Référence produit
Nom du produit
Prix

201

Plante

10

202

Chaise

60

203

Enceinte

100

Jeu de données 2 : Données de vente

Référence produit
Quantité vendue

201

100

202

50

203

30

Dans cet exemple, “Référence produit” est la variable pivot qui permettra de croiser les deux jeux de données.

La fonction RECHERCHEV

La fonction RECHERCHEV permet de rechercher une valeur dans une autre table en fonction d’une clé.

Syntaxe de RECHERCHEV : =RECHERCHEV(valeur_cherchée; table; index_colonne)

où :

  • valeur_cherchée : la valeur à rechercher dans la colonne de la table de référence

  • table : la plage de cellules dans laquelle effectuer la recherche

  • index_colonne : le numéro de colonne dans la plage où se trouve la valeur à retourner (par rapport à la première colonne de la table de référence)

Tutoriel

Les deux jeux de données que vous souhaitez croiser sont sur deux feuilles différentes. Votre variable pivot est le champ “Référence produit”.

  1. Allez dans une nouvelle colonne à côté de votre premier tableau ;

  2. Vous êtes sur la première ligne de données du jeu de données 1, utilisez la formule suivante pour ajouter la quantité vendue provenant du jeu de données 2 en fonction de la “Référence Produit” : =RECHERCHEV(A2; Feuille2.$A$1;$B$4; 2; FAUX)

où :

  • A2 : fait référence à la “Référence Produit” du premier tableau ;

  • Feuille2.$A$1:$B$4 : Plage de cellules contenant les données du second tableau (où effectuer la recherche) ;

  • 2 : signifie que la deuxième colonne de la plage contient la quantité vendue que vous souhaitez récupérer.

  1. LibreOffice Calc remplira la cellule avec la quantité vendue correspondant à la référence produit.

  2. Glissez la formule vers le bas pour remplir toutes les lignes.

Vous devriez obtenir le tableau suivant :

Référence produit
Nom du produit
Prix
Quantité vendue

201

Plante

10

100

202

Chaise

60

50

203

Enceinte

100

30

Lier des données à un référentiel
Base SIRENE des entreprises et de leurs établissements
Base Adresse Nationale
Code Officiel Géographique
Plan Cadastral Informatisé
Répertoire National des Associations
Répertoire Opérationnel des Métiers et des Emplois
Nomenclature d'activités française (NAF)
Répertoire National des Certifications Professionnelles (RNCP) et Répertoire Spécifique (RS)
Fichier FANTOIR des voies et lieux-dits