Accueil > Big Data, IA > Cassandra, mise en oeuvre d’une base de données NoSQL
Formation #BSI72

Formation Cassandra, mise en oeuvre d’une base de données NoSQL

Durée : 4 jours

Code : BSI72


Prochaines dates programmées :

Du 28 au 31 Mai 2024

Du 09 au 12 Juil. 2024

Du 10 au 13 Sept. 2024

Du 26 au 29 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Connaître les apports de Cassandra par rapport à d’autres solutions existantes
  • Découvrir l'architecture du SGBD NoSQL Apache Cassandra
  • Installer et configurer le SGBD NoSQL Apache Cassandra
  • Créer une base de données et manipuler ses objets
  • Maîtriser le langage CQL
  • Découvrir les principes de l'optimisation et du développement
  • Mettre en œuvre et administrer Apache Cassandra au quotidien
  • Etre capable d'effectuer des calculs distribués avec Spark
Programme
1/ Présentation de Cassandra
  • Comprendre le Big Data
  • Cassandra : historique, fonctionnalités, licence, cas d'utilisation
  • Cassandra : choix technique et architecture
  • Format des données et "key-value"
  • Traitement de volumes importants
  • Haute disponibilité
  • Système réparti de base de données
2/ Installation et configuration
  • Pré-requis (sources, plateformes, etc.)
  • Choisir et installer la différente version de Cassandra
  • Configuration d'Apache Cassandra pour un seul nœud
  • Étude du fichier de configuration : conf/cassandra.yaml
  • Démarrer/arrêter une instance de Cassandra
  • Introduction au modèle de données
  • Test de l'interface cliente cqlsh
  • Langage de définition de données de CQL
  • DevCenter de Cassandra
  • Langage de manipulation de données de CQL
  • Comprendre les bases de la modélisation de données pour Cassandra
3/ Les bases de données sous Apache Cassandra
  • Différents modèles de stockage du NoSQL
  • Mise en place du modèle de données orienté colonne
  • Les objets sous Apache Cassandra (Keyspace, familles de colonnes, supercolonnes, colonnes composites)
  • Exemple concret de mise en œuvre
4/ Utilisation du langage déclaratif CQL (Cassandra Query Language)
  • Commandes de base : connexion au système de base de données
  • Création de colonnes, insertion, modification recherche
  • Insertion
  • Modification
  • Recherche
  • Exécution de scripts
  • Ecrire des requêtes
  • Approches
  • Limitations du CQL
5/ Architecture interne de Cassandra
  • Coordination des requêtes
  • Comprendre la réplication des données
  • Maintenir la cohérence des données
  • Comprendre la communication entre les nœuds
  • Comprendre le système des keyspaces
6/ Le Write Path de Cassandra
  • Ecriture des données dans le moteur de stockage
  • Comprendre le fonctionnement des annuaires de données
7/ Le Read Path de Cassandra
  • Lecture des données situées dans le moteur de stockage
  • Choisir et implémenter les stratégies de compilation de données
8/ Administration et exploitation d'Apache Cassandra
  • OpsCenter : installation, lancement
  • Supervision avec nodetool cfstats
  • Surveillance du Cluster
  • L'import et l'export des données
  • Principe des accès JMX
  • Exports JMX vers des outils de supervision comme Nagios
  • Démonstration avec Prométheus et Kibana
  • Gestion des noeuds Cassandra
  • Sauvegardes, snapshots et export au format JSON
  • Principe de cohérence, digest request et read repair
9/ Support Hadoop
  • Principe de MapReduce
  • Implémentation Hadoop
  • Mise en oeuvre depuis Cassandra
10/ Support Spark
  • Description rapide de l'architecture Spark
  • Mise en oeuvre depuis Cassandra
  • Exécution de travaux Spark
11/ Performance
  • Outil de test de performance Cassandra-stress
  • Mise en place d'un plan de stress et paramétrage
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Chefs de projet
  • Gestionnaires de bases de données
Dates

Dates

  • Du 28 au 31 Mai 2024
  • Du 09 au 12 Juil. 2024
  • Du 10 au 13 Sept. 2024
  • Du 26 au 29 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.