Formation #BSI54

Formation Data Science : Analyse de données avec Python

Formation avec Restauration incluse
(Déjeuner, Petit Déjeuner et Pauses Cafés)

Durée : 8 jours

Code : BSI54


Sessions programmées :

Du 09 au 18 Fév. 2021

Du 13 au 22 Avril 2021

Du 15 au 24 Juin 2021

Du 14 au 23 Sept. 2021

Du 09 au 18 Nov. 2021

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email :
  • Pour les entreprises AU MAROC :
    Au minimum 10 JOURS OUVRÉS avant la date de formation
  • Pour les entreprises HORS MAROC :
    Au minimum 15 JOURS OUVRÉS avant la date de formation

Formation dans votre entreprise.

Durée : 8 jours

Code : BSI54


Vous souhaitez réaliser cette formation en vos locaux avec le même programme ?

Vous souhaitez personnaliser le programme de cette formation pour qu'elle réponde aux spécificités de votre entreprise ?

Objectifs

  • Maitriser les bases du langage Python
  • Savoir analyser et Manipuler des données en Python
  • Savoir faire une représentation graphique de données en Python
  • Apprendre à traiter les valeurs manquantes
  • Acquérir des données externes en Python
  • Utiliser les bibliothèques scientifiques de Python
  • Comprendre les performances et la parallélisation
  • Traiter des projets concrets et réels de Data science
Programme
1/ Introduction au langage Python
  • Langage Python : caractéristiques
  • Python pour l’analyse de données
  • Installation et configuration
  • Python (indentation, objet, etc.)
  • Types de données
  • Fonctions et méthodes
  • Structures de contrôles (boucle, test, exceptions)
  • Structures de données et séquences (tuple, liste, primitives, dict)
2/ Aspects avancés en Python
  • Espace de noms, périmètre et fonctions locales
  • Manipuler les fonctions comme des objets
  • Fonctions anonymes (lambda)
  • Syntaxe d’appels étendus (*args, **kwargs)
3/ Manipuler de données avec Python
  • La librairie Pandas
  • Dataframe comme structure de données
  • Interroger ces structures ? Comment ces structures sont indexées ?
  • Gestion des données manquantes
  • Fusion de dataframes
  • Formatage des dates
  • Application de mesures statistiques variées sur les DataFrames
  • Compréhension des problèmes d’échelle de mesure, de normalisation
  • Création de métriques d’analyse
4/ Représentation graphique de données
  • Définir le besoin de la data visualisation
  • Principes de la data visualisation
  • Des graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
  • La librairie Matplotlib
5/ Importer des données externes
  • Formats de données structurées (CSV, flux XML, JSON)
  • Importer des données (texte, csv, Excel, web scrapping., SQL..)
  • Fonctions d‘accès et chargement de données en ligne
6/ Analyses Statistiques
  • Les bibliothèques Python : NumPy, SciPy, IPython (Jupyter)
  • Fonctions de manipulation et de calcul matriciel (Numpy)
  • Fonctions de Statistiques Descriptives (SciPy)
  • Différentes lois statistiques
  • Fonctions de comparaison de populations, mesures d’association
  • Fonctions de classification automatique (SciPy) : k-means
7/ Performances et parallélisation
  • Les outils (Timeit, cProfile)
  • Paralléliser vos traitements avec le multiprocessing
  • Calcul distribué avec la librairie Celery
  • Les faiblesses du multithreading
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Responsables Infocentre
  • Utilisateurs
  • Gestionnaires métiers de bases de données
Dates

Dates

  • Du 09 au 18 Fév. 2021
  • Du 13 au 22 Avril 2021
  • Du 15 au 24 Juin 2021
  • Du 14 au 23 Sept. 2021
  • Du 09 au 18 Nov. 2021
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email :
    • Pour les entreprises AU MAROC : Au minimum 10 JOURS OUVRÉS avant la date de formation
    • Pour les entreprises HORS MAROC : Au minimum 15 JOURS OUVRÉS avant la date de formation