Page 73 - Télécom Evolution Catalogue 2018
P. 73
BIG DATA : PANORAMA DES INFRASTRUCTURES
ET ARCHITECTURES DISTRIBUÉES
DATES & LIEUX FC9BD03
21 au 22 septembre 2017 à Paris 2 jours
29 au 30 mars 2018 à Paris
1370 €
20 au 21 septembre 2018 à Paris
OBJECTIFS ET PRÉSENTATION
Mettre en oeuvre les solutions de passage à l’échelle (scaling). Utiliser les techniques de « scaling vertical » et « scaling horizontal ».
Identifi er les problèmes classiques qu’il est nécessaire de résoudre lors de la mise en place de processus de calculs distribués. Utiliser
et adapter les outils pour le calcul distribué dans le cadre de traitement par lots mais aussi pour le calcul temps-réel.
L’expression « big data » est utilisée aujourd’hui pour décrire les problèmes liés aux besoins croissants d’exploitation des données
massives. L’exploitation intelligente de cette grande quantité d’information est une source de création de valeur pour les entreprises,
qu’il s’agisse de mieux comprendre leur propre fonctionnement, ou d’identifi er les leviers de leur future croissance. Les outils de
calcul distribué sont aujourd’hui devenus essentiels à l’identifi cation des indicateurs de performance (Key Performance Indicators,
KPI) au sein des entreprises et des organisations.
BIG DATA
Cette formation permet d’appréhender et de comprendre au mieux le calcul distribué ainsi que les solutions et outils associés.
PARTICIPANTS ET PRÉREQUIS
Décideurs et ingénieurs désireux de comprendre comment mettre en œuvre des outils pour le big data, qu’il s’agisse du calcul
d’indicateurs en mode traitement par lots (batch processing) ou en temps-réel.
Des connaissances de l’environnement Linux / Unix et de la programmation Java/Python sont requises pour suivre cette formation
avec profi t.
PROGRAMME
Confi guration et administration de
Ecriture de MapReduce pour la
Introduction
Big data - défi nition et contexte
MongoDB résolution de problèmes concrets
Utilisation de MongoDB pour le
Paradigmes de calculs distribués
Calcul temps-réel, Storm, Flink
MapReduce calcul distribué
Diff érences fondamentales entre
Apache Hadoop / Apache Spark traitement par lots et traitement
Problèmes classiques des
Introduction au système de fi chiers temps-réel
architectures distribuées et solutions
Problématique de traitement des fl ux
distribué HDFS
Introduction au paradigme de
de données
Introduction à la gestion de tâches
MapReduce
Présentation d'Apache Kafka pour la
Traitements par lots (batch
MapReduce
mise en tampon des données
Confi guration d'un nœud Hadoop
processing)
Présentation et utilisation de Storm
Principes de fonctionnement de
pour le calcul MapReduce
Introduction à Hadoop Streaming
pour le calcul d'indicateurs en
MapReduce et exemples
pour le prototypage rapide de temps-réel
Technologies NoSQL
MapReduce
Introduction à Flink pour le calcul
temps-réel
Introduction à Spark et Spark
Introduction aux technologies
NoSQL Streaming Synthèse et conclusion
Diff érences SQL/NoSQL
MODALITÉS PÉDAGOGIQUES RESPONSABLE
La formation comprend des travaux pratiques qui Jérémie ALBERT
permettent d’appliquer les notions abordées. Head of Data Architecture dans le
service R&D de l’entreprise Lectra.
Il est spécialiste des architectures
pour le calcul distribué et des
problématiques associées au
passage à l’échelle.
contact@telecom-evolution.fr web www.telecom-evolution.fr 71