Accueil > Big Data, IA > Big Data, méthodes et solutions pratiques pour l’analyse des données
Formation #BSI95

Formation Big Data, méthodes et solutions pratiques pour l’analyse des données

Durée : 5 jours

Code : BSI95


Prochaines dates programmées :

Du 27 au 31 Mai 2024

Du 22 au 26 Juil. 2024

Du 09 au 13 Sept. 2024

Du 11 au 15 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Connaître l'ensemble des concepts et enjeux du Big Data
  • Identifier et s’approprier les outils de l’écosystème BIG DATA
  • Gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques
Programme
1/ Présentation du Big Data
  • Les origines du Big Data
  • Un déluge de données
  • Données internes et externes
  • Les dimensions en V du Big Data : les 3V (Vélocité, Variété et Volume)
  • Les grands acteurs (éditeurs, intégrateurs) et l’Opensource
2/ Enjeux du Big Data
  • Les données au cœur des enjeux
  • Les nouveaux Métiers
  • BIG DATA versus Business Intelligence
  • Liens entre Big Data et internet des objets (IoT)
  • CNIL et règlementations (GDPR)
  • Sécurité IT (tokenisation, anonymisation)
  • Concept de Datalake
  • Datamanagement, traçabilité des données
  • Qualité des données
3/ Les technologies
  • Architecture et Composants Hadoop
  • Le stockage avec Hadoop (NoSQL, HDFS)
  • Fonctionnement de MapReduce et Storm...
  • L'écosystème Hadoop (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights)
  • Installation d'Hadoop
  • Technologies du datascientist
  • Les solutions de visualisation (Tableau, Talend, Qlikview ...)
4/ Gérer les données structurées et non structurées
  • Système de fichiers distribué HDFS : principes
  • Importer des données externes vers HDFS
  • Requêter avec Hive
  • Analyser les données (Pig)
  • Les outils permettant d’extraire les données (ETL)
  • Streaming Data (NIFI, Kafka, Spark, Storm...)
5/ Technique et méthodes Big data analytics
  • Machine Learning
  • Régression, Classification et Clustering
  • Préparation des données (data preparation, feature engineering)
  • Générer des modèles en R ou Python
  • Outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...
6/ Visualisation des données
  • Besoin de la data visualisation
  • Analyse et visualisation des données
  • Principes fondamentaux et objectifs de la dataviz
  • Limites des outils et méthodes traditionnels (Excel, BusinessObjects, etc)
  • Panorama des solutions de datavisualisation : Tableau, Qlik, Microstrategy, Microsoft Power BI…
  • Quels types de visualisation pour quels usages ? comparaison QlikView, Tibco Spotfire, Tableau
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle
Dates

Dates

  • Du 27 au 31 Mai 2024
  • Du 22 au 26 Juil. 2024
  • Du 09 au 13 Sept. 2024
  • Du 11 au 15 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.