Accueil > Big Data, IA > Analyse de données en Python
Formation #BSI54

Formation Analyse de données en Python

Durée : 4 jours

Code : BSI54


Prochaines dates programmées :

Du 28 au 31 Mai 2024

Du 09 au 12 Juil. 2024

Du 10 au 13 Sept. 2024

Du 26 au 29 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Maitriser les bases du langage Python
  • Savoir analyser et Manipuler des données en Python
  • Savoir faire une représentation graphique de données en Python
  • Apprendre à traiter les valeurs manquantes
  • Acquérir des données externes en Python
  • Utiliser les bibliothèques scientifiques de Python
  • Comprendre les performances et la parallélisation
  • Traiter des projets concrets et réels de Data science
Programme
1/ Introduction au langage Python
  • Langage Python : caractéristiques
  • Python pour l’analyse de données
  • Installation et configuration
  • Python (indentation, objet, etc.)
  • Types de données
  • Fonctions et méthodes
  • Structures de contrôles (boucle, test, exceptions)
  • Structures de données et séquences (tuple, liste, primitives, dict)
2/ Aspects avancés en Python
  • Espace de noms, périmètre et fonctions locales
  • Manipuler les fonctions comme des objets
  • Fonctions anonymes (lambda)
  • Syntaxe d’appels étendus (*args, **kwargs)
3/ Manipuler de données avec Python
  • La librairie Pandas
  • Dataframe comme structure de données
  • Interroger ces structures ? Comment ces structures sont indexées ?
  • Gestion des données manquantes
  • Fusion de dataframes
  • Formatage des dates
  • Application de mesures statistiques variées sur les DataFrames
  • Compréhension des problèmes d’échelle de mesure, de normalisation
  • Création de métriques d’analyse
4/ Représentation graphique de données
  • Définir le besoin de la data visualisation
  • Principes de la data visualisation
  • Des graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
  • La librairie Matplotlib
5/ Importer des données externes
  • Formats de données structurées (CSV, flux XML, JSON)
  • Importer des données (texte, csv, Excel, web scrapping., SQL..)
  • Fonctions d‘accès et chargement de données en ligne
6/ Analyses Statistiques
  • Les bibliothèques Python : NumPy, SciPy, IPython (Jupyter)
  • Fonctions de manipulation et de calcul matriciel (Numpy)
  • Fonctions de Statistiques Descriptives (SciPy)
  • Différentes lois statistiques
  • Fonctions de comparaison de populations, mesures d’association
  • Fonctions de classification automatique (SciPy) : k-means
7/ Performances et parallélisation
  • Les outils (Timeit, cProfile)
  • Paralléliser vos traitements avec le multiprocessing
  • Calcul distribué avec la librairie Celery
  • Les faiblesses du multithreading
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Responsables Infocentre
  • Utilisateurs
  • Gestionnaires métiers de bases de données
Dates

Dates

  • Du 28 au 31 Mai 2024
  • Du 09 au 12 Juil. 2024
  • Du 10 au 13 Sept. 2024
  • Du 26 au 29 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.