Données de forte valeur : métadonnées obligatoires et modalités de rapportage
Précisions pratiques pour les producteurs de données de forte valeur
Dernière mise à jour
Cet article vous a-t-il été utile ?
Précisions pratiques pour les producteurs de données de forte valeur
Dernière mise à jour
Cet article vous a-t-il été utile ?
Les données de forte valeur (HVD) ont vocation à remonter sur la plateforme data.gouv.fr dans le cadre des obligations de rapportage établies dans . Les modalités techniques définies ici font l'objet d'un travail concerté et itératif avec plusieurs parties prenantes, notamment dans le cadre de groupes de travail portés par le CNIG. Des discussions sont en cours sur ces modalités techniques et de nouvelles précisions sont à venir.
Ce guide présente :
Il a vocation à être enrichi au gré des nouvelles précisions. Une foire aux questions sera également alimentée.
Pour les producteurs concernés (cf. ), la remontée des données de forte valeur sur data.gouv.fr se déroule selon les étapes suivantes :
Les données sont identifiées comme étant de forte valeur et sont classées dans l’une des 6 grandes catégories précisées dans les 6 annexes du règlement d'exécution (géospatiales, météorologiques, etc.). Selon la catégorie associée, les conditions de mise à disposition et les métadonnées obligatoires diffèrent.
Les données ainsi identifiées remontent au niveau national en étant :
soit moissonnées sur (cf. ) et éventuellement le selon leur nature ;
soit publiées directement sur .
Les données sont moissonnées par pour proposer un catalogue européen des données de forte valeur.
Plusieurs métadonnées sont obligatoires dans le cadre des données de forte valeur.
Une métadonnée identifiant le jeu de données comme étant un HVD via l'utilisation d'un mot clé "hvd"*.
Une métadonnée identifiant la catégorie HVD à laquelle la donnée appartient
via les mots clés suivant* :
Météorologiques
Entreprises et propriété d'entreprises
Géospatiales
Mobilité Observation de la terre et environnement Statistiques Les mots clés sur data.gouv.fr sont automatiquement normalisés (mis en minuscule, etc.).
Avant le 10 décembre 2024, les organisations/ministères doivent s’assurer que leurs jeux de données HVD sont :
accessibles via API
accompagnés des métadonnées attendues
directement consultables depuis la fiche associée
Ex : API
Ex : Domaine de l'eau
A partir du 10 décembre 2024, l’équipe data.gouv.fr
vérifie en parallèle un par un que les jeux de données respectent bien les exigences
A partir de fin décembre, l'équipe data.gouv.fr
fige le rapport
complète avec les autres infos demandées par la Commission (analyse d’impact, documentation d’orientation sur la publication, réutilisation, etc.)
envoi le rapport complet à l’Europe
Les données géospatiales
Les données sur l’observation de la Terre et l’environnement
Les données de mobilité
Pour éviter une double saisie, les producteurs de données ne produisent et ne maintiennent qu'une seule fiche, répondant aux deux législations. La remontée se fait ensuite de manière automatique au niveau européen pour répondre à ces deux obligations.
Voici une proposition de schéma de rapportage dans le cas de jeux de données concernés à la fois par la directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur :
Pour qu’une même fiche de données soit doublement moissonnée mais ne soit pas créée de manière dupliquée au niveau européen, il est important que l’identifiant de la fiche de données soit stable dans le temps et correctement préservé au cours des différents moissonnages.
Les producteurs de données doivent donc être particulièrement vigilants lors de la mise en place des différents moissonnages.
La licence des données. Celle-ci doit être équivalente ou moins restrictive que la . Nous recommandons la . En savoir plus sur les ou sur les .
*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du ().
Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, pour disposer d'un identifiant stable dans le temps.
La licence des données. Celle-ci doit être équivalente ou moins restrictive que la . Nous recommandons la . En savoir plus sur les ou sur les .
*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du ().
Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, pour disposer d'un identifiant stable dans le temps.
Aujourd’hui, ne permet pas de modéliser et de moissonner les métadonnées d'API comme attendu dans le cadre des HVD. sont en cours sur le sujet.
Les Etats membres de l'Union européenne sont soumis à une obligation de rapportage tous les deux ans auprès de la Commission européenne, dans le cadre du (article 5).
Les producteurs de données ne sont pas responsables de ce rapportage. Celui-ci se base sur le catalogue qui moissonne les informations depuis via un vocabulaire spécifique (DCAT) HVD.
Avec les données correctement remontées au niveau européen, a une vision générale des HVDs par Etat Membre (). Afin de faciliter la création du rapport, data.europa.eu propose des requêtes Sparql pour construire l'ensemble des métadonnées attendues (les ensembles de données, les licences, les liens API, etc.) à partir des informations disponibles sur .
.
Nous avons préparé un premier afin de donner un aperçu des métadonnées disponibles par producteur sur . Nous allons itérer pour intégrer l'entièreté des requêtes et donc métadonnées attendues pour le rapportage.
correctement renseignés sur (basé sur )
commence à constituer le rapport basé sur les données HVD collectées depuis
La remontée des données INSPIRE se fait via le , portail national géré par le Bureau de recherches géologiques et minières (BRGM) et dédié aux données géographiques.
La remontée des données de forte valeur, quant à elle, se fait via , la plateforme nationale des données publiques françaises, gérée par la Direction interministérielle du numérique (DINUM).
Cependant, pour 3 catégories d'ensembles de données de forte valeur, et le règlement d'exécution se rapportant aux données de forte valeur se recoupent et se renforcent :
Dans ce cas, les métadonnées doivent également respecter le cadre défini par .
La question des identifiants fait l’objet d’ lors du .