Accueil > Big Data, IA > Python : modélisation et représentation des données
Formation #BSI55

Formation Python : modélisation et représentation des données

Durée : 5 jours

Code : BSI55


Prochaines dates programmées :

Du 29 Avril au 03 Mai 2024

Du 03 au 07 Juin 2024

Du 26 au 30 Août 2024

Du 28 Oct. au 01 Nov. 2024

Du 30 au 03 Jan. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Appréhender le principe de la modélisation selon leur problématique
  • Arriver à choisir entre la régression et la classification
  • Évaluer les performances prédictives d'un algorithme
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
  • Utiliser différentes méthodes d'exploration de données
Programme
1/ Introduction au langage Python
  • Les caractéristiques du langage Python
  • Pourquoi choisir Python pour l’analyse de données ?
  • Installation et configuration
  • Philosophie de Python (indentation, objet, etc.)
  • Les types de données
  • Appels de fonctions et méthodes
  • Structures de contrôles (boucle, test, exceptions)
  • Structures de données et séquences (tuple, liste, primitives, dict)
2/ Modélisation
  • Présentation Jupiter Notebook
  • Construction d'un modèle : étapes
  • Algorithmes supervisés et non supervisés
  • Le choix entre la régression et la classification
3/ Evaluation de modèles : procédures
  • Les techniques de ré-échantillonnage
  • Test de représentativité des données d'apprentissage
  • Mesures de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC
4/ Algorithmes supervisés
  • Le principe de régression linéaire univariée
  • La régression multivariée
  • La régression polynomiale
  • La régression régularisée
  • Le Naive Bayes
  • L’arbre de décision
  • La régression logistique
  • Les K plus proches voisins
5/ Les algorithmes non supervisés
  • Le clustering hiérarchique
  • Le clustering non hiérarchique
  • Les approches mixtes
6/ Analyse en composantes
  • Analyse en Composantes Principales
  • Analyse du nuage des individus
  • Propriétés des composantes principales
  • Analyse du nuage des variables
  • Interprétation des résultats
  • Analyse des correspondances
  • Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux
  • Analyse des nuages des profils
  • Liens entre les analyses
  • Interprétation des résultats
  • Analyse des Correspondances Multiples
  • Analyse des correspondances sur le tableau disjonctif complet
  • Propriétés de l’ACM
  • Analyse du tableau de Burt
  • Analyse Factorielle pour Données Mixtes
  • Classification
  • Classification ascendante hiérarchique : principe, stratégies d’agrégation, aides à l’interprétation
  • Méthodes de partitionnement : les méthodes des centres mobiles, les nuées dynamiques
  • Classification mixte
7/ Analyse de données textuelles
  • Collecte et prétraitement des données textuelles
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique
  • Lemmatisation
  • Représentation vectorielle des textes
  • Pondération TF-IDF
  • Word2Vec
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Responsables Infocentre
  • Utilisateurs
  • Gestionnaires métiers de bases de données
Dates

Dates

  • Du 29 Avril au 03 Mai 2024
  • Du 03 au 07 Juin 2024
  • Du 26 au 30 Août 2024
  • Du 28 Oct. au 01 Nov. 2024
  • Du 30 au 03 Jan. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.