Accueil > Big Data, SGBD, IA, BI, SAP > Big Data : synthèse technique
Formation #BSI04

Formation Big Data : synthèse technique

Formation avec Restauration incluse
(Déjeuner, Petit Déjeuner et Pauses Cafés)

Durée : 3 jours

Code : BSI04


Sessions programmées :

Du 27 au 29 Jan. 2021

Du 17 au 19 Mars 2021

Du 19 au 21 Mai 2021

Du 21 au 23 Juil. 2021

Du 20 au 22 Oct. 2021

Du 22 au 24 Déc. 2021

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email :
  • Pour les entreprises AU MAROC :
    Au minimum 10 JOURS OUVRÉS avant la date de formation
  • Pour les entreprises HORS MAROC :
    Au minimum 15 JOURS OUVRÉS avant la date de formation

Formation dans votre entreprise.

Durée : 3 jours

Code : BSI04


Vous souhaitez réaliser cette formation en vos locaux avec le même programme ?

Vous souhaitez personnaliser le programme de cette formation pour qu'elle réponde aux spécificités de votre entreprise ?

Objectifs

  • Découvrir les principaux concepts du Big Data
  • Comprendre les spécificités propres aux projets Big Data
  • Apprendre à mettre en œuvre une plateforme complète pour gérer vos données
  • Travailler avec Hadoop, Spark et Talend pour la datavisualisation
Programme
1/ Comprendre le Big Data
  • Définitions, historique
  • Concepts fondamentaux et caractéristiques clés du Big Data
  • Les origines du Big Data
  • La provenance des données
  • Changements de quantité, de qualité, d'habitudes
  • La valeur de la donnée : un changement d'importance
  • La donnée en tant que matière première
  • Le quatrième paradigme de la découverte scientifique
  • 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité…)
  • Collecte et traitement des données structurées, semi-structurées et non-déstructurées
  • Transformation des données en informations
  • Création de la valeur à partir des données
  • Différences et apports par rapport aux technologies traditionnelles
  • Exemples d’application et usages des technologies Big Data
2/ L’implémentation d’un projet Big Data : méthodologie
  • Les besoins métiers et objectifs d’un projet
  • Spécificités d’un projet Big Data
  • Sélectionner les bons outils
  • Poser les bonnes questions
  • Obtenir les données
  • Explorer et prétraiter les données
  • Analyser les données : planifier et construire un modèle viable
  • Communiquer les résultats
  • Transformer les résultats en décisions et en actions
3/ Technologies et solutions associées au Big Data
  • Architecture et composants de la plateforme Hadoop 2
  • Les modes de stockage (NoSQL, HDFS)
  • Fonctionnement de MapReduce et Yarn…
  • Principales distributions Hadoop : Hortonworks, Cloudera, MapR…
  • Les technologies émergentes : Spark, Storm, Machine Learning Azure…
  • Installation d'une plateforme Hadoop
  • Panorama des solutions de datavisualisation pour le Big Data (Talend, Tableau, Qlikview…)
4/ Collecte, stockage et traitement des données
  • Connaître les différentes sources de données (internes/externes, publiques/privées)
  • Analyser les caractéristiques d’un jeu de données
  • Créer des flux de données massives avec un ETL (Extract Transform Load) : présentation et prise en main de Talend
  • Gérer les spécificités des données semi et non-structurées
  • Rappels des principes du stockage distribué
  • Bases de données NoSQL (Cassandra, Neo4j, MongoDB…)
  • Prise en main d’HDFS et du modèle MapReduce
  • Requêter et traiter les données avec Pig et Hive
  • ElasticSearch pour l’indexation et la recherche de données
5/ Analyse et traitements des données issues du Big Data
  • Différentes méthodes et techniques d’analyse
  • Notions d’analyse statistique et prédictive
  • L’impact de l’augmentation des volumes de données
  • Analyser un ensemble de données avec l’environnement Apache Spark
  • Comprendre les apports de la convergence entre Big Data et intelligence artificielle
  • Introduction aux principes de Machine Learning
  • Les familles de modèles : régression, classification, clustering, reinforcement learning, NLP
  • Technique de feature engineering pour préparer les données
  • Sélectionner, entraîner et tester un algorithme de Machine Learning
  • Principes du Deep Learning : apprentissage profond et réseaux neuronaux
6/ Data visualisation : Apprendre à communiquer sur les données
  • Les enjeux et objectifs d’une bonne communication
  • Principes fondamentaux de la représentation visuelle
  • La Datavisualisation tout au long du processus Big Data
  • Techniques et outils principaux pour la visualisation de données (Tableau, Qlik, etc)
  • Sélectionner une solution de datavisualisation selon l’objectif recherché
  • Bonnes pratiques de Dataviz
  • Visualisation interactive
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle
Dates

Dates

  • Du 27 au 29 Jan. 2021
  • Du 17 au 19 Mars 2021
  • Du 19 au 21 Mai 2021
  • Du 21 au 23 Juil. 2021
  • Du 20 au 22 Oct. 2021
  • Du 22 au 24 Déc. 2021
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email :
    • Pour les entreprises AU MAROC : Au minimum 10 JOURS OUVRÉS avant la date de formation
    • Pour les entreprises HORS MAROC : Au minimum 15 JOURS OUVRÉS avant la date de formation