Croiser des données
Dans le cadre de vos travaux, il peut s’avérer intéressant de croiser plusieurs jeux de données entre eux, et ainsi créer des jeux de données enrichis.
Le croisement de données consiste à joindre des jeux de données distincts en utilisant un attribut commun.
Liste de variables pivots communes
Voici une liste non exhaustive de variables pivots qu’il est possible d’utiliser pour croiser des données.
SIREN, SIRET
Identifiant des entreprises françaises et de leurs établissements
Code Officiel Géographique
Codes et libellés des communes, des cantons, des arrondissements, des départements, des régions et des pays et territoires étrangers
N°RNCP/N°RS
Identifiant des certifications professionnelles
N°Fantoir
Identifiant des lieux-dits et des voies pour chaque commune
Pour en savoir plus, nous vous invitons à consulter la section “Lier des données à un référentiel” du guide qualité.
Exemple : Croiser deux jeux de données avec le logiciel de tableur LibreOffice Calc
Données d’exemple
Jeu de données 1 : Données de produits
201
Plante
10
202
Chaise
60
203
Enceinte
100
Jeu de données 2 : Données de vente
201
100
202
50
203
30
Dans cet exemple, “Référence produit” est la variable pivot qui permettra de croiser les deux jeux de données.
La fonction RECHERCHEV
La fonction RECHERCHEV permet de rechercher une valeur dans une autre table en fonction d’une clé.
Syntaxe de RECHERCHEV : =RECHERCHEV(valeur_cherchée; table; index_colonne)
où :
valeur_cherchée : la valeur à rechercher dans la colonne de la table de référence
table : la plage de cellules dans laquelle effectuer la recherche
index_colonne : le numéro de colonne dans la plage où se trouve la valeur à retourner (par rapport à la première colonne de la table de référence)
Tutoriel
Les deux jeux de données que vous souhaitez croiser sont sur deux feuilles différentes. Votre variable pivot est le champ “Référence produit”.
Allez dans une nouvelle colonne à côté de votre premier tableau ;
Vous êtes sur la première ligne de données du jeu de données 1, utilisez la formule suivante pour ajouter la quantité vendue provenant du jeu de données 2 en fonction de la “Référence Produit” : =RECHERCHEV(A2; Feuille2.$A$1;$B$4; 2; FAUX)
où :
A2 : fait référence à la “Référence Produit” du premier tableau ;
Feuille2.$A$1:$B$4 : Plage de cellules contenant les données du second tableau (où effectuer la recherche) ;
2 : signifie que la deuxième colonne de la plage contient la quantité vendue que vous souhaitez récupérer.
LibreOffice Calc remplira la cellule avec la quantité vendue correspondant à la référence produit.
Glissez la formule vers le bas pour remplir toutes les lignes.
Vous devriez obtenir le tableau suivant :
201
Plante
10
100
202
Chaise
60
50
203
Enceinte
100
30
Dernière mise à jour