Données de forte valeur : métadonnées obligatoires et modalités de rapportage

Précisions pratiques pour les producteurs de données de forte valeur

Rappel juridique

La "Directive Open Data" (Directive 2019/1024) définit les données de forte valeur comme les "documents détenus par un organisme du secteur public, dont la réutilisation est associée à des bénéfices importants pour la société, l'environnement et l'économie". Il s'agit alors de les mettre à disposition avec un minimum de restrictions légales et techniques afin d'augmenter leur potentiel de réutilisation et leur impact. Un règlement d'exécution (2023/138) établit la liste des ensembles de données de forte valeur. Les données de forte valeur devront être mises à disposition gratuitement en vue de leur réutilisation pour le 9 juin 2024.

Les données de forte valeur (HVD) ont vocation à remonter sur la plateforme data.gouv.fr dans le cadre des obligations de rapportage établies dans le règlement d'exécution. Les modalités techniques définies ici font l'objet d'un travail concerté et itératif avec plusieurs parties prenantes, notamment dans le cadre de groupes de travail portés par le CNIG. Des discussions sont en cours sur ces modalités techniques et de nouvelles précisions sont à venir.

Ce guide présente :

Il a vocation à être enrichi au gré des nouvelles précisions. Une foire aux questions sera également alimentée.

Processus global de remontée des fiches de données sur data.gouv.fr

Pour les producteurs concernés (cf. ouverture.data.gouv.fr), la remontée des données de forte valeur sur data.gouv.fr se déroule selon les étapes suivantes :

  1. Les données sont identifiées comme étant de forte valeur et sont classées dans l’une des 6 grandes catégories précisées dans les 6 annexes du règlement d'exécution (géospatiales, météorologiques, etc.). Selon la catégorie associée, les conditions de mise à disposition et les métadonnées obligatoires diffèrent.

  2. Les données ainsi identifiées remontent au niveau national en étant :

  3. Les données sont moissonnées par data.europa.eu pour proposer un catalogue européen des données de forte valeur.

Métadonnées obligatoires pour les données de forte valeur

Plusieurs métadonnées sont obligatoires dans le cadre des données de forte valeur.

  1. Une métadonnée identifiant le jeu de données comme étant un HVD via l'utilisation d'un mot clé "hvd"*.

  2. Une métadonnée identifiant la catégorie HVD à laquelle la donnée appartient

    via les mots clés suivant* :

    Météorologiques

    Entreprises et propriété d'entreprises

    Géospatiales

    Mobilité Observation de la terre et environnement Statistiques Les mots clés sur data.gouv.fr sont automatiquement normalisés (mis en minuscule, etc.).

  3. La licence des données. Celle-ci doit être équivalente ou moins restrictive que la CC BY 4.0 DEED. Nous recommandons la licence ouverte 2.0. En savoir plus sur les licences utilisables par les administrations ou sur les conditions de réutilisations qui s'appliquent si aucune licence n'est indiquée.

*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du référentiel européen (exemple pour la catégorie météorologique).

Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, précisé ici dans le contexte des données de forte valeur pour disposer d'un identifiant stable dans le temps.

Les modalités de rapportage à la Commission européenne depuis data.gouv.fr

Les Etats membres de l'Union européenne sont soumis à une obligation de rapportage tous les deux ans auprès de la Commission européenne, dans le cadre du règlement d'exécution (article 5).

Les producteurs de données ne sont pas responsables de ce rapportage. Celui-ci se base sur le catalogue data.europa.eu qui moissonne les informations depuis data.gouv.fr via un vocabulaire spécifique Data Catalogue Vocabulary (DCAT) HVD.

Avec les données correctement remontées au niveau européen, data.europa.eu a une vision générale des HVDs par Etat Membre (exemple pour la France). Afin de faciliter la création du rapport, data.europa.eu propose des requêtes Sparql pour construire l'ensemble des métadonnées attendues (les ensembles de données, les licences, les liens API, etc.) à partir des informations disponibles sur data.europa.eu.

Voir plus d'information sur ces outils de rapportage via data.europa.eu.

Nous avons préparé un premier tableau de bord afin de donner un aperçu des métadonnées disponibles par producteur sur data.europa.eu. Nous allons itérer pour intégrer l'entièreté des requêtes et donc métadonnées attendues pour le rapportage.

Chronologie

  • Avant le 10 décembre 2024, les organisations/ministères doivent s’assurer que leurs jeux de données HVD sont :

Les producteurs sont également tenus de justifier la non disponibilité des données, que ce soit en téléchargement ou via une API, en détaillant : les raisons de cette non disponibilité, les actions en cours pour y remédier, et le calendrier prévisionnel détaillant les étapes de mise à disposition. Ces informations peuvent être transmises sous forme d’un tableau à data.gouv.fr (voir exemple ci-dessous) :

API/TéléchargementNom du HVDURL du jeu de donnéesProducteurRaisonsActions en coursCalendrier prévisionnel

Ex : API

Ex : Domaine de l'eau

  • A partir du 10 décembre 2024, l’équipe data.gouv.fr

    • commence à constituer le rapport basé sur les données HVD collectées depuis data.europa.eu

    • vérifie en parallèle un par un que les jeux de données respectent bien les exigences

  • A partir de fin décembre, l'équipe data.gouv.fr

    • fige le rapport

    • complète avec les autres infos demandées par la Commission (analyse d’impact, documentation d’orientation sur la publication, réutilisation, etc.)

    • envoi le rapport complet à l’Europe

L'articulation entre la Directive INSPIRE et le règlement d'exécution relatif aux données de forte valeur

INSPIRE est une directive qui vise à établir une infrastructure d'information géographique pour l'environnement, à l'échelle européenne.

"Données de forte valeur" découle de la directive Open Data et est un label attribué à des données dont la mise en open data peut générer un impact économique, social et environnemental significatif.

La remontée des données INSPIRE se fait via le géocatalogue, portail national géré par le Bureau de recherches géologiques et minières (BRGM) et dédié aux données géographiques.

La remontée des données de forte valeur, quant à elle, se fait via data.gouv.fr, la plateforme nationale des données publiques françaises, gérée par la Direction interministérielle du numérique (DINUM).

Cependant, pour 3 catégories d'ensembles de données de forte valeur, la Directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur se recoupent et se renforcent :

  • Les données géospatiales

  • Les données sur l’observation de la Terre et l’environnement

  • Les données de mobilité

Dans ce cas, les métadonnées doivent également respecter le cadre défini par la Directive INSPIRE.

Pour éviter une double saisie, les producteurs de données ne produisent et ne maintiennent qu'une seule fiche, répondant aux deux législations. La remontée se fait ensuite de manière automatique au niveau européen pour répondre à ces deux obligations.

Voici une proposition de schéma de rapportage dans le cas de jeux de données concernés à la fois par la directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur :

Pour qu’une même fiche de données soit doublement moissonnée mais ne soit pas créée de manière dupliquée au niveau européen, il est important que l’identifiant de la fiche de données soit stable dans le temps et correctement préservé au cours des différents moissonnages.

Les producteurs de données doivent donc être particulièrement vigilants lors de la mise en place des différents moissonnages.

La question des identifiants fait l’objet d’un point et d'une recommandation lors du groupe de travail métadonnées du CNIG.

Dernière mise à jour