Page 74 - Télécom Evolution Catalogue 2018
P. 74
DATA SCIENCE DANS LE CLOUD : BIG DATA,
STATISTIQUES ET MACHINE LEARNING
FC9BD09 DATES & LIEUX
3 jours 4 au 6 avril 2018 à Paris
1880 €
OBJECTIFS ET PRÉSENTATION
Utiliser et adapter les nouvelles pratiques et méthodes pour le traitement de données massives sur une plate-forme Cloud en ligne.
Mettre en œuvre les méthodes classiques de fouille de données.
L’émergence des nouvelles technologies informatiques de type big data et cloud computing a révolutionné notre capacité d’analyse
des données et d’extraction des connaissances, cœur du métier du data scientist.
Dans cette formation, nous utilisons des outils big data sur la plate-forme Cloud de Google afi n de réaliser des analyses statistiques
et du Machine Learning. Au travers de cas d’étude concrets sur des données climatiques, nous explorons plusieurs décennies de
données satellitaires.
BIG DATA Ingénieurs, chefs de projets souhaitant pratiquer des outils statistiques et informatiques du big data sur des données réelles.
PARTICIPANTS ET PRÉREQUIS
Des notions en bases de données, en programmation informatique et en méthodes statistiques permettent de tirer un meilleur profi t
de la formation.
PROGRAMME
Problématiques sous-jacentes (étude
Gestion du coût d'utilisation
Introduction
Présentation des concepts principaux Introduction aux plate-formes de tendances, mise en évidence
d'oscillations, interpolation /
abordés pendant la formation: distribuées et technologies du big data extrapolation / classifi cation de
Stockage et processing distribués
Big data, data science, cloud
données)
Bases de données distribuées
computing, machine learning, Algorithmes de Machine Learning
langage Python (NoSQL Columnar Storage)
Méthodes de régression usuelles
Processing de données pour analyses
Prise en main de Google Cloud Platform
en mode batch (Hadoop, Spark / (linéaires ou non, paramétriques ou
Python) non)
Machines virtuelles (Compute)
Analyse interactive de données
Méthodes de classifi cation
Stockage en ligne (Storage)
Plate-forme de traitements
(BigQuery) (supervisées ou non, paramétriques
(DataProc) Présentation du jeu de données réelles ou non)
Variables observées Synthèse et conclusion
Environnement d'analyse de données
(Datalab)
RESPONSABLES MODALITÉS PÉDAGOGIQUES
Pierre TANDEO François ROUSSEAU La formation comprend des travaux pratiques qui
Docteur en mathématiques Professeur en traitement permettent d’appliquer les notions abordées.
appliquées à IMT Atlantique. Il d’images à IMT Atlantique. Il a
travaille depuis environ 10 ans une grande connaissance les
sur l’utilisation des statistiques outils d’apprentissage statistique
pour la fouille de données tels que la régression et la
environnementales, notamment classifi cation.
sur des données spatiales.
72 contact@telecom-evolution.fr web www.telecom-evolution.fr