Analyser des données avec Python
Python est un langage de programmation :
interprété (lorsqu’on écrit une instruction, on peut directement l’exécuter), idéal pour développer rapidement et tester des algorithmes d’analyse de données ;
de haut niveau (une seule ligne de code permet de réaliser des processus complexes), qui rend plus facile le développement d’un programme ;
à la syntaxe simple et lisible.
open source et gratuit.
Il permet de faire de l’analyse de données, de la programmation web, de la gestion de bases de données, etc.
Python est l’un des langages de programmation les plus utilisés.
Source : Formation SSPy ; Université Paris Cité
Parcours d’initiation à Python
Cette formation peut être réalisée :
sur la plateforme SSP Cloud de l’Insee, où elle est hébergée : cette option n’est ouverte qu’aux agents publics ;
dans un jupyter notebook. Pour en savoir plus sur le jupyter notebook, comment l’installer et l’utiliser, vous pouvez consulter les sections correspondantes du cours de Python proposé par l’Université Paris Cité (Conseils pour installer et configurer Python ; Jupyter et ses notebooks).
Pour aller plus loin

Approfondir ses connaissances en Python pour la data science : manipulation de données, visualisation, modélisation, traitement du langage naturel.
![]()
Autres ressources pédagogiques
Voici un catalogue (non exhaustif) d'autres ressources pédagogiques pour apprendre à utiliser Python.
Niveau débutant
[Formation] Initiation à Python par l'INRAE (Sandra Dérozier & Thomas Duigou)
Programme :
Introduction à Python
Introduction à Jupyter
Variables
Affichage
Listes, Tuples & Sets
Dictionnaires
Structures de contrôle
Boucles
Fichiers
Modules
Exercice complet
[Formation] Introduction à la programmation Python pour la biologie par l'Université Paris Cité (Patrick Fuchs & Pierre Poulain)
Programme :
Variables
Affichage
Listes
Boucles et comparaisons
Tests
Fichiers
Dictionnaires et tuples
Modules
Fonctions
Conteneurs
Création de modules
Bonnes pratiques en programmation Python
Expressions régulières
Jupyter et ses notebooks
Module Biopython
Module NumPy
Module Matplotlib
Module Pandas
Avoir la classe avec les objets
Fenêtres graphiques et Tkinter
Mini-projets
[Formation] Data Analysis Using Python: A Beginner’s Guide Featuring NYC Open Data par NYC open data (Mark Bauer) 🇬🇧
Programme :
Reading and Writing Files in Python
Data Inspection, Cleaning, and Wrangling in Python
Plotting and Data Visualization in Python
Geospatial Data and Mapping
[Cours en ligne] Intro to programming par Kaggle 🇬🇧
Programme :
Arithmétique et variables
Fonctions
Types de données
Conditions
Introduction aux listes
[Cours en ligne] Python par Kaggle 🇬🇧
Programme :
Introduction à Python
Fonctions
Booléens et conditions
Listes
Boucles
Strings et dictionnaires
Travailler avec des librairies externes
Niveau intermédiaire
[Formation] Python avancé par l'INRAE (Sandra Dérozier & Thomas Duigou)
Programme :
Fonctions
Modules
Gestion des erreurs
Expressions régulières
Requests (API)
Numpy
Pandas
Biopython
Matplotlib
Exercice complet
[Cours en ligne] Pandas par Kaggle 🇬🇧
Programme :
Créer, lire et écrire
Indexation, sélection et affectation
Fonction de synthèse et cartes
Regrouper et trier
Types de données et valeurs manquantes
Renommer et combiner
[Cours en ligne] Datavisualisation par Kaggle 🇬🇧
Programme :
Seaborn
Graphiques en courbe
Diagrammes en barres et heatmaps
Nuages de point
Choix des types de graphiques
[Cours en ligne] Intro to machine learning par Kaggle 🇬🇧
Programme :
Fonctionnement des modèles
Exploration des données de base
Votre premier modèle d’apprentissage automatique
Validation du modèle
Random forests
Niveau avancé
[Cours en ligne] Intermediate machine learning par Kaggle 🇬🇧
Programme :
Valeurs manquantes
Variables catégorielles
Pipelines
Cross validation
XGBoost
Data leakage
[Cours en ligne] Feature engineering par Kaggle 🇬🇧
Programme :
What is Feature Engineering
Mutual information
Creating features
Clustering with K-Means
Principle Component Analysis
Target encoding
[Cours en ligne] Tous les cours proposés par HuggingFace 🇬🇧
Programme : Traitement du langage naturel, apprentissage par renforcement profond, computer vision, machine learning pour les jeux, etc.
Ce guide est ouvert aux contributions. 💌 Vous avez des idées d'autres ressources pédagogiques sur l'utilisation de Python que nous pourrions référencer ici ? Faites-nous en part dans ce formulaire.
Mis à jour
Ce contenu vous a-t-il été utile ?



