Page 74 - Télécom Evolution Catalogue 2018
P. 74

DATA SCIENCE DANS LE CLOUD : BIG DATA,
               STATISTIQUES ET MACHINE LEARNING

          FC9BD09                                                                                  DATES & LIEUX

           3 jours                                                                          4 au 6 avril 2018 à Paris
           1880 €



                OBJECTIFS ET PRÉSENTATION
          Utiliser et adapter les nouvelles pratiques et méthodes pour le traitement de données massives sur une plate-forme Cloud en ligne.
          Mettre en œuvre les méthodes classiques de fouille de données.

          L’émergence des nouvelles technologies informatiques de type big data et cloud computing a révolutionné notre capacité d’analyse
          des données et d’extraction des connaissances, cœur du métier du data scientist.
          Dans cette formation, nous utilisons des outils big data sur la plate-forme Cloud de Google afi n de réaliser des analyses statistiques
          et du Machine Learning. Au travers de cas d’étude concrets sur des données climatiques, nous explorons plusieurs décennies de
          données satellitaires.
      BIG DATA  Ingénieurs, chefs de projets souhaitant pratiquer des outils statistiques et informatiques du big data sur des données réelles.
                PARTICIPANTS ET PRÉREQUIS


          Des notions en bases de données, en programmation informatique et en méthodes statistiques  permettent de tirer un meilleur profi t
          de la formation.

                PROGRAMME
                                                                                      Problématiques sous-jacentes (étude
                                                   Gestion du coût d'utilisation
          Introduction                         ƒ                                   ƒ
            Présentation des concepts principaux     Introduction aux plate-formes   de tendances, mise en évidence
                                                                                    d'oscillations, interpolation /
          abordés pendant la formation:       distribuées et technologies du big data     extrapolation / classifi cation de
                                                     Stockage et processing distribués
                 Big data, data science, cloud
            ƒ                                  ƒ                                    données)
                                                   Bases de données distribuées
             computing, machine learning,      ƒ                                   Algorithmes de Machine Learning
             langage Python                      (NoSQL Columnar Storage)
                                                                                        Méthodes de régression usuelles
                                               ƒ                                   ƒ
                                                   Processing de données pour analyses
            Prise en main de Google Cloud Platform
                                                 en mode batch (Hadoop, Spark /     (linéaires ou non, paramétriques ou
            ƒ                                    Python)                            non)
             Machines virtuelles (Compute)
                                                   Analyse interactive de données
            ƒ                                  ƒ                                   ƒ
                                                                                      Méthodes de classifi cation
               Stockage en ligne (Storage)
               Plate-forme de traitements
            ƒ                                    (BigQuery)                         (supervisées ou non, paramétriques
             (DataProc)                         Présentation du jeu de données réelles   ou non)
            ƒ                                    Variables observées               Synthèse et conclusion
               Environnement d'analyse de données
             (Datalab)                         ƒ











          RESPONSABLES                                                       MODALITÉS PÉDAGOGIQUES
                        Pierre TANDEO            François ROUSSEAU     La formation comprend des travaux pratiques qui
                Docteur en mathématiques         Professeur en traitement   permettent d’appliquer les notions abordées.
              appliquées à IMT Atlantique. Il   d’images à IMT Atlantique. Il a
              travaille depuis environ 10 ans   une grande connaissance les
              sur l’utilisation des statistiques   outils d’apprentissage statistique
                 pour la fouille de données    tels que la régression et la
             environnementales, notamment                 classifi cation.
                 sur des données spatiales.









   72                                      contact@telecom-evolution.fr        web www.telecom-evolution.fr
   69   70   71   72   73   74   75   76   77   78   79