Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)
Les dimensions en V du Big Data : les 3V (Vélocité, Variété et Volume)
Les technologies essentielles
Les grands acteurs (éditeurs, intégrateurs) et l’Opensource
2/ Aperçu des frameworks et des outils du Big Data
Limites des outils et des paradigmes classiques
Historique des technologies Big Data : Google’s GFS & MapReduce
Principaux Frameworks du Big Data : Hadoop, Spark, Storm, etc
Classification des outils du Big Data selon leurs cas d’usage :
Stockage et traitement de la donnée
Les bases de données et la gestion des données
La sérialisation
Le management et le monitoring
L’analyse et la visualisation des données
Le transfert des données
La sécurité et le contrôle d’accès
Solutions Big Data sur le Cloud
Les Frameworks et les outils Big Data utilisés : avantages, limites, évolutions
3/ Rappel sur les langages
Python (application de la MapReduce)
Les mathématiques de base (algèbre, statistiques, probabilités)
SQL
4/ Hadoop
Comprendre Hadoop et ses composants
HDFS : Hadoop distributed file system
MapReduce : Traitement simplifié de données sur des grands clusters
YARN : Gestionnaire de ressources du cluster Hadoop
Différences entre les distributions (Hortonworks, Cloudera, MapR) pour le développeur
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
Elasticsearch : Indexer et rechercher des données
Les visualiser à l’aide de KIBANA
Quand utiliser le couplage Elasticsearch, Logstash, Kibana (ELK) ?
Le moteur de recherche SolR
SAS VA et autres solutions mixtes Cloud/On Premice pour explorer vos données
IBM Watson (fédération des informations)
Solution BI Classique
5/ Les algorithmes et analyse de données
Les concepts du Machine Learning
Les données supervisées ou non supervisées ? Quelles différences ?
Régression
Modèles linéaires
Classification
Naive Bayes
K-NN
K-Means clustering
Réseaux de neurones
Arbres de décisions et de régression
Support vector machines
Méthodes ensemblistes
6/ Le développement (Mapreduce, Spark)
MapReduce : Philosophie et contraintes
Briques logicielles pour le développeur
Exemple de pseudo-code pour les opérations map et reduce
Limites de MapReduce et émergence de Spark
Les différentes versions de Spark (Scala, Python et Java)
Des traitements en mémoire et tolérants aux pannes RDD
Les modes de travail en cluster de Spark
7/ Machine Learning avec : Spark et Spark Streaming
Introduction à Apache Spark
Faire du Machine Learning avec Apache Spark MLlib
Traiter les données en temps réel
Requêter en format SQL avec Apache Spark SQL
Manipuler des graphes avec GraphX
Stockage basé sur les graphes
8/ La visualisation des données
La valeur de la visualisation
Modèles de données et images
Données multidimensionnelles
Principes de design
Perception graphique
9/ Restitution et pilotage
Couleurs
Itérations sur la perception
Techniques d'interactions
Visualisation Big Data
Approche Pédagogique
Approche Pédagogique
Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
Cas pratiques
Remise d’outils
Echanges d’expériences
Public cible
Public cible
Data analysts
Data scientists
Experts en recherche opérationnelle
Développeurs
Dates
Dates
Du 22 au 26 Avril 2024
Du 03 au 07 Juin 2024
Du 05 au 09 Août 2024
Du 21 au 25 Oct. 2024
Du 23 au 27 Déc. 2024
Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.