Page 72 - Télécom Evolution Catalogue 2018
P. 72

DATA SCIENCE : INTRODUCTION
               AU MACHINE LEARNING

          FC9BD04                                                                                  DATES & LIEUX

           2 jours                                                                  25 au 26 septembre 2017 à Paris
                                                                                           12 au 13 avril 2018 à Paris
           1370 €
                                                                                    27 au 28 septembre 2018 à Paris


                OBJECTIFS ET PRÉSENTATION
          Identifi er  la nature des problèmes traités par les techniques d’apprentissage, les principes de base de la théorie (minimisation
          du risque, pénalisation, convexifi cation), les heuristiques des algorithmes majeurs en machine learning, les règles expérimentales
          permettant de comparer les performances de diff érentes techniques d’apprentissage. Mettre en place des plans expérimentaux,
          mettre en œuvre les algorithmes d’apprentissage sur des données réelles ou simulées, interpréter les règles prédictives obtenues et
          mesurer leur performance.
          Les sciences de l’information transforment aujourd’hui de nombreux domaines tels que la médecine, la fi nance, le marketing, la
          défense ou encore la sécurité. La capacité à traiter et analyser des données de très grande dimension, souvent massives (big data)
          est un enjeu majeur dans ces secteurs d’activités. La discipline qui développe et étudie des méthodes concrètes pour modéliser
      BIG DATA  ce type de données est le machine learning. A l’interface des mathématiques appliquées et de l’informatique, cette discipline vise
          à produire des outils de prédiction et d’aide à la décision, automatiquement, à partir d’un apprentissage sur des données et des
          évènements. L’apparition d’algorithmes très performants pour la classifi cation de données en grande dimension, tels que le boosting
          ou les suppors vector machines (SVM) dans le milieu des années 90, a progressivement transformé le champ occupé jusqu’alors par
          la statistique traditionnelle. Celle-ci s’appuyait en grande partie sur le prétraitement réalisé par l’opérateur humain.
          Cette formation présente le domaine et ses fondements. Ses problèmes et ses méthodes les plus récentes sont également étudiés.
          Les concepts sont illustrés par des applications variées.
                PARTICIPANTS ET PRÉREQUIS
          Ingénieurs et techniciens ayant besoin de méthodes d’apprentissage pour automatiser des tâches (prédiction, décision, etc.) de
          manière performante. Chefs de projets qui souhaitent mieux identifi er les tâches que le machine learning permettrait d’automatiser.

          Avoir des connaissances de base dans le domaine des mathématiques (analyse, statistique, optimisation) et une expérience de la
          programmation en Python est nécessaire pour tirer un meilleur profi t de la formation.

                PROGRAMME
                                                   Application des principes de
            Introduction au machine learning et   ƒ                                Travaux Pratiques
          apprentissage supervisé                validation croisée, des méthodes de         Mise en œuvre d'algorithmes de ma-
             Problèmes supervisés, non
            ƒ                                    ré-échantillonnage (bootstrap)    chine-learning «  avancés  »et application
             supervisés, batch, on-line         Apprentissage non supervisé et   de techniques récentes pour l'apprentis-
            ƒ                                 méthodes avancées d'apprentissage   sage non supervisé : réduction de dimen-
               Principe de la minimisation du risque
             empirique                         ƒ                                 sion, clustering (KMeans), text-mining
                                                 Convexifi cation, agrégation
            ƒ                                  ƒ                                   Synthèse et conclusion
               Evaluation des performances –
                                                   Boosting, forêts aléatoires, machines
             design expérimental                 à vecteurs de support
            ƒ                                  ƒ
             Sélection de modèles
                                                   Méthodes de sélection de variables
            Travaux pratiques                    pour la régression
                                                   Big data: échantillonnage,
            ƒ                                  ƒ
                 Mise en œuvre d'algorithmes
                                                 apprentissage distribué, graph
             «  classiques  » – perceptron,
             régression, k-plus proches voisins   mining




          RESPONSABLE                                                        MODALITÉS PÉDAGOGIQUES
                  Stephan CLEMENCON                                    La formation comprend des travaux pratiques qui
                Professeur au département                              permettent de valider les notions abordées. Ces
               « Image, Données et Signal »                            travaux pratiques utilisent des packages Python.
                 de Télécom ParisTech, ses
            recherches portent sur la théorie
              statistique de l’apprentissage.
              Il est coordinateur de la chaire
                 « Machine Learning for big
            data » et enseigne le « machine-
            learning » à Télécom ParisTech, à
             l’ENSAE ParisTech, à l’Université
                  Paris 7 et à l’ENS Cachan.





   70                                      contact@telecom-evolution.fr        web www.telecom-evolution.fr
   67   68   69   70   71   72   73   74   75   76   77