Données de forte valeur : métadonnées obligatoires et modalités de rapportage

Précisions pratiques pour les producteurs de données de forte valeur

Rappel juridique

La "Directive Open Data" (Directive 2019/1024) définit les données de forte valeur comme les "documents détenus par un organisme du secteur public, dont la réutilisation est associée à des bénéfices importants pour la société, l'environnement et l'économie". Il s'agit alors de les mettre à disposition avec un minimum de restrictions légales et techniques afin d'augmenter leur potentiel de réutilisation et leur impact. Un règlement d'exécution (2023/138) établit la liste des ensembles de données de forte valeur. Les données de forte valeur devront être mises à disposition gratuitement en vue de leur réutilisation pour le 9 juin 2024.

Les données de forte valeur (HVD) ont vocation à remonter sur la plateforme data.gouv.fr dans le cadre des obligations de rapportage établies dans le règlement d'exécution. Les modalités techniques définies ici font l'objet d'un travail concerté et itératif avec plusieurs parties prenantes, notamment dans le cadre de groupes de travail portés par le CNIG. Des discussions sont en cours sur ces modalités techniques et de nouvelles précisions sont à venir.

Ce guide présente :

Il a vocation à être enrichi au gré des nouvelles précisions. Une foire aux questions sera également alimentée.

Processus global de remontée des fiches de données sur data.gouv.fr

Pour les producteurs concernés (cf. ouverture.data.gouv.fr), la remontée des données de forte valeur sur data.gouv.fr se déroule selon les étapes suivantes :

  1. Les données sont identifiées comme étant de forte valeur et sont classées dans l’une des 6 grandes catégories précisées dans les 6 annexes du règlement d'exécution (géospatiales, météorologiques, etc.). Selon la catégorie associée, les conditions de mise à disposition et les métadonnées obligatoires diffèrent.

  2. Les données ainsi identifiées remontent au niveau national en étant :

  3. Les données sont moissonnées par data.europa.eu pour proposer un catalogue européen des données de forte valeur.

Métadonnées obligatoires pour les données de forte valeur

Plusieurs métadonnées sont obligatoires dans le cadre des données de forte valeur.

  1. Une métadonnée identifiant le jeu de données comme étant un HVD via l'utilisation d'un mot clé "hvd"*.

  2. Une métadonnée identifiant la catégorie HVD à laquelle la donnée appartient

    via les mots clés suivant* :

    Météorologiques

    Entreprises et propriété d'entreprises

    Géospatiales

    Mobilité Observation de la terre et environnement Statistiques Les mots clés sur data.gouv.fr sont automatiquement normalisés (mis en minuscule, etc.).

  3. La licence des données. Celle-ci doit être équivalente ou moins restrictive que la CC BY 4.0 DEED. Nous recommandons la licence ouverte 2.0. En savoir plus sur les licences utilisables par les administrations ou sur les conditions de réutilisations qui s'appliquent si aucune licence n'est indiquée.

*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du référentiel européen (exemple pour la catégorie météorologique).

Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, précisé ici dans le contexte des données de forte valeur pour disposer d'un identifiant stable dans le temps.

Les modalités de rapportage à la Commission européenne depuis data.gouv.fr

Les Etats membres de l'Union européenne sont soumis à une obligation de rapportage auprès de la Commission européenne, dans le cadre du règlement d'exécution.

Les producteurs de données ne sont pas responsables de ce rapportage. Celui-ci se fait par le catalogue data.gouv.fr via Data Catalogue Vocabulary (DCAT).

Les nouvelles lignes directrices pour la description en DCAT de ces jeux de données de forte valeur ont fait l'objet d’un travail concerté au niveau européen et des Etats membres.

Aujourd’hui, certaines des métadonnées demandées ne sont pas correctement modélisées ou moissonnées dans data.gouv.fr. C’est le cas des informations de description de service pour les APIs. Ces points sont bien identifiés et seront résolus en amont de l’application du règlement relatif aux données de forte valeur. Ils font l'objet de discussions lors du groupe de travail métadonnées du CNIG.

L'articulation entre la Directive INSPIRE et le règlement d'exécution relatif aux données de forte valeur

INSPIRE est une directive qui vise à établir une infrastructure d'information géographique pour l'environnement, à l'échelle européenne.

"Données de forte valeur" découle de la directive Open Data et est un label attribué à des données dont la mise en open data peut générer un impact économique, social et environnemental significatif.

La remontée des données INSPIRE se fait via le géocatalogue, portail national géré par le Bureau de recherches géologiques et minières (BRGM) et dédié aux données géographiques.

La remontée des données de forte valeur, quant à elle, se fait via data.gouv.fr, la plateforme nationale des données publiques françaises, gérée par la Direction interministérielle du numérique (DINUM).

Cependant, pour 3 catégories d'ensembles de données de forte valeur, la Directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur se recoupent et se renforcent :

  • Les données géospatiales

  • Les données sur l’observation de la Terre et l’environnement

  • Les données de mobilité

Dans ce cas, les métadonnées doivent également respecter le cadre défini par la Directive INSPIRE.

Pour éviter une double saisie, les producteurs de données ne produisent et ne maintiennent qu'une seule fiche, répondant aux deux législations. La remontée se fait ensuite de manière automatique au niveau européen pour répondre à ces deux obligations.

Voici une proposition de schéma de rapportage dans le cas de jeux de données concernés à la fois par la directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur :

Pour qu’une même fiche de données soit doublement moissonnée mais ne soit pas créée de manière dupliquée au niveau européen, il est important que l’identifiant de la fiche de données soit stable dans le temps et correctement préservé au cours des différents moissonnages.

Les producteurs de données doivent donc être particulièrement vigilants lors de la mise en place des différents moissonnages.

La question des identifiants fait l’objet d’un point et d'une recommandation lors du groupe de travail métadonnées du CNIG.

Dernière mise à jour