Page 72 - Télécom Evolution Catalogue 2018
P. 72
DATA SCIENCE : INTRODUCTION
AU MACHINE LEARNING
FC9BD04 DATES & LIEUX
2 jours 25 au 26 septembre 2017 à Paris
12 au 13 avril 2018 à Paris
1370 €
27 au 28 septembre 2018 à Paris
OBJECTIFS ET PRÉSENTATION
Identifi er la nature des problèmes traités par les techniques d’apprentissage, les principes de base de la théorie (minimisation
du risque, pénalisation, convexifi cation), les heuristiques des algorithmes majeurs en machine learning, les règles expérimentales
permettant de comparer les performances de diff érentes techniques d’apprentissage. Mettre en place des plans expérimentaux,
mettre en œuvre les algorithmes d’apprentissage sur des données réelles ou simulées, interpréter les règles prédictives obtenues et
mesurer leur performance.
Les sciences de l’information transforment aujourd’hui de nombreux domaines tels que la médecine, la fi nance, le marketing, la
défense ou encore la sécurité. La capacité à traiter et analyser des données de très grande dimension, souvent massives (big data)
est un enjeu majeur dans ces secteurs d’activités. La discipline qui développe et étudie des méthodes concrètes pour modéliser
BIG DATA ce type de données est le machine learning. A l’interface des mathématiques appliquées et de l’informatique, cette discipline vise
à produire des outils de prédiction et d’aide à la décision, automatiquement, à partir d’un apprentissage sur des données et des
évènements. L’apparition d’algorithmes très performants pour la classifi cation de données en grande dimension, tels que le boosting
ou les suppors vector machines (SVM) dans le milieu des années 90, a progressivement transformé le champ occupé jusqu’alors par
la statistique traditionnelle. Celle-ci s’appuyait en grande partie sur le prétraitement réalisé par l’opérateur humain.
Cette formation présente le domaine et ses fondements. Ses problèmes et ses méthodes les plus récentes sont également étudiés.
Les concepts sont illustrés par des applications variées.
PARTICIPANTS ET PRÉREQUIS
Ingénieurs et techniciens ayant besoin de méthodes d’apprentissage pour automatiser des tâches (prédiction, décision, etc.) de
manière performante. Chefs de projets qui souhaitent mieux identifi er les tâches que le machine learning permettrait d’automatiser.
Avoir des connaissances de base dans le domaine des mathématiques (analyse, statistique, optimisation) et une expérience de la
programmation en Python est nécessaire pour tirer un meilleur profi t de la formation.
PROGRAMME
Application des principes de
Introduction au machine learning et Travaux Pratiques
apprentissage supervisé validation croisée, des méthodes de Mise en œuvre d'algorithmes de ma-
Problèmes supervisés, non
ré-échantillonnage (bootstrap) chine-learning « avancés »et application
supervisés, batch, on-line Apprentissage non supervisé et de techniques récentes pour l'apprentis-
méthodes avancées d'apprentissage sage non supervisé : réduction de dimen-
Principe de la minimisation du risque
empirique sion, clustering (KMeans), text-mining
Convexifi cation, agrégation
Synthèse et conclusion
Evaluation des performances –
Boosting, forêts aléatoires, machines
design expérimental à vecteurs de support
Sélection de modèles
Méthodes de sélection de variables
Travaux pratiques pour la régression
Big data: échantillonnage,
Mise en œuvre d'algorithmes
apprentissage distribué, graph
« classiques » – perceptron,
régression, k-plus proches voisins mining
RESPONSABLE MODALITÉS PÉDAGOGIQUES
Stephan CLEMENCON La formation comprend des travaux pratiques qui
Professeur au département permettent de valider les notions abordées. Ces
« Image, Données et Signal » travaux pratiques utilisent des packages Python.
de Télécom ParisTech, ses
recherches portent sur la théorie
statistique de l’apprentissage.
Il est coordinateur de la chaire
« Machine Learning for big
data » et enseigne le « machine-
learning » à Télécom ParisTech, à
l’ENSAE ParisTech, à l’Université
Paris 7 et à l’ENS Cachan.
70 contact@telecom-evolution.fr web www.telecom-evolution.fr