Cette page a vocation à vous éclairer sur les différents concepts rencontrés dans le cadre d'une démarche d'ouverture ou de réutilisation de données.
L'administration englobe l’État, les collectivités territoriales ainsi que les autres personnes de droit public ou les personnes de droit privé chargées d'une mission de service public (Article L300-2 du CRPA) ;
Processus consistant à traiter des données à caractère personnel afin d’empêcher totalement et de manière irréversible l’identification d’une personne physique. L’anonymisation suppose donc qu’il n’y ait plus aucun lien possible entre l’information concernée et la personne à laquelle elle se rattache.
Une API est une interface, un contrat passé entre deux systèmes informatiques pour leur permettre de communiquer. Cette solution informatique permet d’automatiser des tâches depuis votre ordinateur ou vos serveurs.
La Base Adresse Nationale est l’une des neuf bases de données du service public des données de référence. Elle est la seule base de données d’adresses officiellement reconnue par l’administration.
Sous co-pilotage DINUM, ANCT et IGN, sa construction est assurée grâce à de nombreux partenaires et en premier lieu par les communes, seules autorités compétentes en terme d’adressage.
La Base Adresse Nationale est accessible sous forme de fichiers et d’API.
Un service de géocodage gratuit est mis à disposition par Etalab.
Fichier géré par une collectivité locale (habituellement une commune ou un EPCI) et contenant toutes ses adresses géolocalisées. Une Base Adresse Locale publiée et à jour garantit une meilleure prise en compte des adresses dans les différents systèmes d’information des acteurs, qu’ils soient privés ou publics. Depuis 2019, les Bases Adresses Locales sont prioritaires dans la Base Adresse Nationale : une commune qui publie sa Base Adresse Locale devient la seule source d'adresses sur son territoire.
data.gouv.fr est la plateforme ouverte et communautaire qui vise à centraliser et structurer les données ouvertes en France. Elle vise à favoriser la transparence et l’efficacité de l’action publique tout en facilitant la création de nouveaux services. data.gouv.fr est une plateforme communautaire qui s’adresse :
À ceux qui produisent des données (producteurs de données) et qui souhaitent ouvrir leurs données ;
À ceux qui exploitent des données (réutilisateurs de données) et qui veulent télécharger des données et partager leurs réalisations ;
À tout citoyen qui souhaite découvrir des données ou trouver une information.
La documentation d'un jeu de données décrit les données et la structure des fichiers publiés. Elle a une visée pédagogique et facilite la réutilisation des données.
Tout document que l'administration a pu produire ou recevoir (de la part d’une autre administration ou d’un prestataire par exemple), dans le cadre de sa mission de service public (Article L300-2 du CRPA). Ces documents peuvent correspondre à des notes de services, une base de données, une législation, un code source de logiciel, des cartes, un algorithme, etc.
Toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification (par exemple le numéro de sécurité sociale) ou à un ou plusieurs éléments qui lui sont propres.
Représentation d’une information publique sous une forme conventionnelle destinée à faciliter son traitement. Cela peut être par exemple des données géographiques (adresses, références cadastrales), financières (budgets, commande publique, subventions, etc.), environnementales (émissions, vente de produits, etc.), etc.
Information contenue dans un document administratif communicable à tous ou faisant l'objet d'une diffusion publique, sur lequel des tiers ne détiennent pas de droits de propriété intellectuelle (Article L321-2 du CRPA)
Un jeu de donnée sur data.gouv.fr est un ensemble de ressources ou d’informations (fichiers de données, fichiers d’explications, API etc.) et de métadonnées (description, producteur, date de publication, mots-clefs, couverture géographique temporelle etc.) sur un thème donné.
Une métadonnée est une donnée qui décrit ou définit une autre donnée.
Dans la vie courante, l’étiquette d’un produit fournit des informations/métadonnées sur le produit (origine, composition, date de péremption, etc.). Appliqué aux jeux de données, les métadonnées sont des descriptions normalisées du contenu du jeu.
Un modèle de données décrit la structure logique du jeu de données sous la forme d'objets (ou entités) et de relations (ou associations). Les objets sont définis par une liste d'attributs. Le modèle de données est avant tout un outil de dialogue entre les différents intervenants.
Le moissonnage est un mécanisme permettant de collecter les métadonnées sur un catalogue distant et de les stocker sur une autre plateforme afin de proposer un second point d’accès aux données.
Les données ouvertes (open data) sont des données en accès libre et gratuit et facilement réutilisables par toutes et tous.
Ces données sont produites par l’administration (ministères, collectivités locales, etc.) mais aussi par des acteurs privés ou encore des citoyens.
L'open data public consiste à assurer la large mise à disposition à tous des données publiques, en accès libre et gratuit, sous un format numérique facilement réutilisable.
Sur data.gouv.fr, une organisation est une entité au travers de laquelle plusieurs utilisateurs peuvent collaborer. Les jeux de données publiés au nom de l’organisation peuvent être édités par les membres de l’organisation. Elle peut contenir plusieurs utilisateurs et un même utilisateur peut appartenir à plusieurs organisations.
Plusieurs critères permettent d'évaluer le niveau de qualité d'un jeu de données, notamment :
Des éléments sur les données elles-mêmes et leur structure (format, structure, contenu, etc.)
Des éléments attestant du potentiel de réutilisation et de croisement des données (respect de standards, données pivot, etc.)
Des éléments qui accompagnent les données (documentation, etc.)
Une réutilisation désigne communément l’exploitation de données ouvertes par des tiers, à d’autres fins que celle de la mission de service public pour laquelle elles ont été produites ou reçues.
Elle peut prendre la forme d’une visualisation, d’une application, d’un article de presse, d’un papier de recherche, etc.
Les documents couverts par un secret légal sont :
Les documents qui ne sont aucunement communicables. Ce sont par exemple les documents dont la diffusion porterait atteinte au secret des délibérations du Gouvernement, au secret de la défense nationale ou de la sûreté de l’État, etc. (Article L. 311-5 du CRPA).
Les documents dont la diffusion porterait atteinte à la protection de la vie privée, au secret médical et au secret des affaires. Les documents qui portent une appréciation ou un jugement de valeur sur une personne physique ou qui font apparaître le comportement d’une personne (Article L. 311-6 du CRPA).
Le service public de la donnée créé par l’Article 14 de la loi pour une République numérique vise à mettre à disposition, en vue de faciliter leur réutilisation, les jeux de données de référence qui présentent le plus fort impact économique et social.
À ce jour, neuf jeux de données, qui couvrent un large champ thématique ont été identifiés comme des données de référence.
Un schéma de données permet de décrire la structure d'un fichier d'un jeu de données.
Il indique clairement quels sont les différents champs, comment sont représentées les données, quelles sont les valeurs possibles, leur format, etc.
schema.data.gouv.fr est l’initiative de data.gouv.fr de référencement des schémas de données publiques pour la France.
Cette plateforme de référencement national permet un accès aux schémas produits par différents acteurs et facilite l’intégration avec des systèmes informatiques par le biais de standards, d’URLs stables, de processus de validation et d’API.