Croiser des données
Dans le cadre de vos travaux, il peut s’avérer intéressant de croiser plusieurs jeux de données entre eux, et ainsi créer des jeux de données enrichis.
Le croisement de données consiste à joindre des jeux de données distincts en utilisant un attribut commun.
Liste de variables pivots communes
Voici une liste non exhaustive de variables pivots qu’il est possible d’utiliser pour croiser des données.
Variable pivot | Description | Jeu de données référentiel associé |
---|---|---|
SIREN, SIRET | Identifiant des entreprises françaises et de leurs établissements | |
BAN | Adresses du territoire français | |
Code Officiel Géographique | Codes et libellés des communes, des cantons, des arrondissements, des départements, des régions et des pays et territoires étrangers | |
Plan Cadastral Informatisé | Identifiant des parcelles cadastrales | |
N°RNA | Identifiant des associations françaises | |
Code ROME | Identifiant des métiers et des emplois | |
Code NAF | Nomenclature des activités économiques productives | |
N°RNCP/N°RS | Identifiant des certifications professionnelles | |
N°Fantoir | Identifiant des lieux-dits et des voies pour chaque commune |
Pour en savoir plus, nous vous invitons à consulter la section “Lier des données à un référentiel” du guide qualité.
Exemple : Croiser deux jeux de données avec le logiciel de tableur LibreOffice Calc
Données d’exemple
Jeu de données 1 : Données de produits
Référence produit | Nom du produit | Prix |
---|---|---|
201 | Plante | 10 |
202 | Chaise | 60 |
203 | Enceinte | 100 |
Jeu de données 2 : Données de vente
Référence produit | Quantité vendue |
---|---|
201 | 100 |
202 | 50 |
203 | 30 |
Dans cet exemple, “Référence produit” est la variable pivot qui permettra de croiser les deux jeux de données.
La fonction RECHERCHEV
La fonction RECHERCHEV permet de rechercher une valeur dans une autre table en fonction d’une clé.
Syntaxe de RECHERCHEV : =RECHERCHEV(valeur_cherchée; table; index_colonne)
où :
valeur_cherchée : la valeur à rechercher dans la colonne de la table de référence
table : la plage de cellules dans laquelle effectuer la recherche
index_colonne : le numéro de colonne dans la plage où se trouve la valeur à retourner (par rapport à la première colonne de la table de référence)
Tutoriel
Les deux jeux de données que vous souhaitez croiser sont sur deux feuilles différentes. Votre variable pivot est le champ “Référence produit”.
Allez dans une nouvelle colonne à côté de votre premier tableau ;
Vous êtes sur la première ligne de données du jeu de données 1, utilisez la formule suivante pour ajouter la quantité vendue provenant du jeu de données 2 en fonction de la “Référence Produit” : =RECHERCHEV(A2; Feuille2.$A$1;$B$4; 2; FAUX)
où :
A2 : fait référence à la “Référence Produit” du premier tableau ;
Feuille2.$A$1:$B$4 : Plage de cellules contenant les données du second tableau (où effectuer la recherche) ;
2 : signifie que la deuxième colonne de la plage contient la quantité vendue que vous souhaitez récupérer.
LibreOffice Calc remplira la cellule avec la quantité vendue correspondant à la référence produit.
Glissez la formule vers le bas pour remplir toutes les lignes.
Vous devriez obtenir le tableau suivant :
Référence produit | Nom du produit | Prix | Quantité vendue |
---|---|---|---|
201 | Plante | 10 | 100 |
202 | Chaise | 60 | 50 |
203 | Enceinte | 100 | 30 |
Dernière mise à jour