LogoLogo
✉️ Contact💬 Forum
Guides de data.gouv.fr
Guides de data.gouv.fr
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de data.gouv.fr
    • Créer un compte utilisateur et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Certifier une organisation
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
        • Publier une Base Adresse Locale
      • Gérer un jeu de données
      • Explorer un jeu de donnée
      • Télécharger le catalogue de données de data.gouv.fr
      • Accéder au catalogue via SPARQL
    • API
      • Publier une API
      • Gérer une API
      • Outils pour les administrations
        • Doctrine des API
        • Accompagnement humain
        • Datapass : Outil d'habilitations
        • Bouquets API Entreprise et API Particulier
    • Réutilisations
      • Publier une réutilisation
      • Gérer une réutilisation
    • Statistiques
    • Ressource communautaire
    • Moissonnage
      • Comprendre les limites du moissonnage
      • Les différents types de moissonneurs
      • Mettre en place un moissonneur
      • Analyser le rapport de moissonnage
      • Moissonnage des plateformes géographiques
    • API de data.gouv.fr
      • Prise en main de l'API
      • Tutoriel d'utilisation
      • Gérer un jeu de données par l'API
      • Référence
        • site
        • datasets
        • reuses
        • discussions
        • organizations
        • spatial
        • users
        • me
        • contacts
        • workers
        • tags
        • topics
        • posts
        • transfer
        • notifications
        • avatars
        • harvest
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Guides sur l'utilisation des données
    • Introduction à l'open data
      • Comprendre la notion d'open data
      • Comprendre l'écosystème de l'open data
      • Comprendre les conditions d'utilisation des données en open data
      • Découvrir et utiliser data.gouv.fr
    • Guide traitement et analyse de données
      • Trouver des données
      • Prendre connaissance et évaluer la qualité de données
      • Explorer des données
      • Récupérer des données
      • Manipuler des données
        • Ouvrir des données
        • Filtrer des données
        • Nettoyer des données
        • Croiser des données
        • Géocoder des adresses
      • Analyser des données
        • Analyser des données avec le tableur LibreOffice Calc
        • Analyser des données avec Python
        • Analyser des données avec R
      • Visualiser des données
      • Cartographier des données
      • Réaliser des projets utiles et s'inspirer
      • Poser des questions aux producteurs de données
      • Valoriser ses travaux
      • Autres ressources pédagogiques
    • Guide API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Guide données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Guide données météorologiques
    • Guide API "Adresse" de l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
    • Les algorithmes publics : pourquoi et comment les expliquer ?
      • Les algorithmes publics : enjeux et obligations
      • Fiche pratique : l'obligation de mention explicite
      • Fiche pratique : l'inventaire des principaux traitements algorithmiques
      • Liste de ressources
    • Codes sources du secteur public : lesquels ouvrir, pourquoi et comment ?
      • Ce document n'est pas...
      • Cadre juridique
    • Catalogage de données - GRIST
    • 📒Guide du participant au Hackathon Météo
      • Ressources du hackathon
        • Données
        • Prise en main des données
        • Outils
        • Programme
        • Informations pratiques
        • Contacts
      • Avant le hackathon
      • Pendant le hackathon : règles et bonnes pratiques
        • Choix du défi
        • Constitution des équipes
        • Sollicitation des mentors
        • Documentation des réalisations
        • Rendu intermédiaire
        • Soumission du projet
        • Evaluation des projets
      • Après le hackathon
        • Evaluation du hackathon
        • Valorisation de votre projet
Propulsé par GitBook
Sur cette page
  • Parcours d’initiation à Python
  • Pour aller plus loin
  • Autres ressources pédagogiques
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé

Cet article vous a-t-il été utile ?

Modifier sur GitHub
Exporter en PDF
  1. Guides sur l'utilisation des données
  2. Guide traitement et analyse de données
  3. Analyser des données

Analyser des données avec Python

PrécédentAnalyser des données avec le tableur LibreOffice CalcSuivantAnalyser des données avec R

Dernière mise à jour il y a 4 mois

Cet article vous a-t-il été utile ?

Python est un langage de programmation :

  • interprété (lorsqu’on écrit une instruction, on peut directement l’exécuter), idéal pour développer rapidement et tester des algorithmes d’analyse de données ;

  • de haut niveau (une seule ligne de code permet de réaliser des processus complexes), qui rend plus facile le développement d’un programme ;

  • à la syntaxe simple et lisible.

  • open source et gratuit.

Il permet de faire de l’analyse de données, de la programmation web, de la gestion de bases de données, etc.

Python est l’un des langages de programmation les plus utilisés.

Source : Formation SSPy ; Université Paris Cité

Parcours d’initiation à Python

Cette formation peut être réalisée :

  • , où elle est hébergée : cette option n’est ouverte qu’aux agents publics ;

  • dans un jupyter notebook. Pour en savoir plus sur le jupyter notebook, comment l’installer et l’utiliser, vous pouvez consulter les sections correspondantes du cours de Python proposé par l’Université Paris Cité ( ; ).

Pour aller plus loin

Autres ressources pédagogiques

Voici un catalogue (non exhaustif) d'autres ressources pédagogiques pour apprendre à utiliser Python.

Niveau débutant

[Formation] Initiation à Python par l'INRAE (Sandra Dérozier & Thomas Duigou)

Programme :

  • Introduction à Python

  • Introduction à Jupyter

  • Variables

  • Affichage

  • Listes, Tuples & Sets

  • Dictionnaires

  • Structures de contrôle

  • Boucles

  • Fichiers

  • Modules

  • Exercice complet

[Formation] Introduction à la programmation Python pour la biologie par l'Université Paris Cité (Patrick Fuchs & Pierre Poulain)

Programme :

  • Variables

  • Affichage

  • Listes

  • Boucles et comparaisons

  • Tests

  • Fichiers

  • Dictionnaires et tuples

  • Modules

  • Fonctions

  • Conteneurs

  • Création de modules

  • Bonnes pratiques en programmation Python

  • Expressions régulières

  • Jupyter et ses notebooks

  • Module Biopython

  • Module NumPy

  • Module Matplotlib

  • Module Pandas

  • Avoir la classe avec les objets

  • Fenêtres graphiques et Tkinter

  • Mini-projets

[Formation] Data Analysis Using Python: A Beginner’s Guide Featuring NYC Open Data par NYC open data (Mark Bauer) 🇬🇧

Programme :

  • Reading and Writing Files in Python

  • Data Inspection, Cleaning, and Wrangling in Python

  • Plotting and Data Visualization in Python

  • Geospatial Data and Mapping

[Cours en ligne] Intro to programming par Kaggle 🇬🇧

Programme :

  • Arithmétique et variables

  • Fonctions

  • Types de données

  • Conditions

  • Introduction aux listes

[Cours en ligne] Python par Kaggle 🇬🇧

Programme :

  • Introduction à Python

  • Fonctions

  • Booléens et conditions

  • Listes

  • Boucles

  • Strings et dictionnaires

  • Travailler avec des librairies externes

Niveau intermédiaire

[Formation] Python avancé par l'INRAE (Sandra Dérozier & Thomas Duigou)

Programme :

  • Fonctions

  • Modules

  • Gestion des erreurs

  • Expressions régulières

  • Requests (API)

  • Numpy

  • Pandas

  • Biopython

  • Matplotlib

  • Exercice complet

[Cours en ligne] Pandas par Kaggle 🇬🇧

Programme :

  • Créer, lire et écrire

  • Indexation, sélection et affectation

  • Fonction de synthèse et cartes

  • Regrouper et trier

  • Types de données et valeurs manquantes

  • Renommer et combiner

[Cours en ligne] Datavisualisation par Kaggle 🇬🇧

Programme :

  • Seaborn

  • Graphiques en courbe

  • Diagrammes en barres et heatmaps

  • Nuages de point

  • Choix des types de graphiques

[Cours en ligne] Intro to machine learning par Kaggle 🇬🇧

Programme :

  • Fonctionnement des modèles

  • Exploration des données de base

  • Votre premier modèle d’apprentissage automatique

  • Validation du modèle

  • Random forests

Niveau avancé

[Cours en ligne] Intermediate machine learning par Kaggle 🇬🇧

Programme :

  • Valeurs manquantes

  • Variables catégorielles

  • Pipelines

  • Cross validation

  • XGBoost

  • Data leakage

[Cours en ligne] Feature engineering par Kaggle 🇬🇧

Programme :

  • What is Feature Engineering

  • Mutual information

  • Creating features

  • Clustering with K-Means

  • Principle Component Analysis

  • Target encoding

[Cours en ligne] Tous les cours proposés par HuggingFace 🇬🇧

Programme : Traitement du langage naturel, apprentissage par renforcement profond, computer vision, machine learning pour les jeux, etc.

Ce guide est ouvert aux contributions. 💌 Vous avez des idées d'autres ressources pédagogiques sur l'utilisation de Python que nous pourrions référencer ici ? .

Accéder à la formation
Accéder à la formation
Accéder à la formation
Accéder au cours
Accéder au cours
Accéder à la formation
Accéder au cours
Accéder au cours
Accéder au cours
Accéder au cours
Accéder au cours
Accéder aux cours
Faites-nous en part dans ce formulaire
sur la plateforme SSP Cloud de l’Insee
Conseils pour installer et configurer Python
Jupyter et ses notebooks
Cover

Maîtriser les fondamentaux du langage Python pour réaliser des opérations de traitement et d’analyse de données.

Cover

Approfondir ses connaissances en Python pour la data science : manipulation de données, visualisation, modélisation, traitement du langage naturel.

Cover

S'initier aux outils méthodologiques et logiciels de l'apprentissage automatique.

10.5281/zenodo.7220306