Page 66 - Télécom Evolution Catalogue 2018
P. 66

MOOC : FONDAMENTAUX POUR LE BIG DATA


          FO9BD01                                                                                         DATES

                                                                                    Début de cours : consulter le site
                                                                                        Effort estimé en heures : 24

                                                                                                Durée : 7 semaines

                PRÉSENTATION
          Le big data offre de nouvelles opportunités au sein des entreprises et administrations. De nombreuses formations préparant aux
          métiers du big data existent. Au sein de Télécom ParisTech, nous proposons un Mastère Spécialisé « Big Data : Gestion et analyse des
          données massives » et un Certificat d’Etudes Spécialisées « Data Scientist ». Le suivi de ces formations nécessite des connaissances
          de base en statistiques, en mathématiques et en informatique.
          L’objectif de ce MOOC est de fournir ces connaissances de base. Les compétences visées par le MOOC constituent un préalable
          indispensable aux formations préparant aux métiers du big data dans les domaines de l’analyse, l’algèbre, les probabilités, les
          statistiques, la programmation Python et les bases de données.
          D’une part, les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées
          dans les contextes big data. Ce MOOC en explique les raisons.
      BIG DATA  D’autre part, le langage Python est un langage très utilisé dans le domaine du traitement des grandes masses de données. Ce cours
          initie à la programmation basée sur ce langage, particulièrement avec la bibliothèque Numpy.
          Enfin, le traitement des données massives et la prédiction nécessitent des analyses statistiques. Cette formation fournit les concepts
          élémentaires en statistiques tels que les processus aléatoires, le calcul différentiel, les fonctions convexes, les problèmes d’optimisation
          et les modèles de régression. Ces bases sont appliquées à un algorithme de classification, le Perceptron.
          Un test de connaissance de type quiz est organisé avant le début du MOOC afin de vérifier le niveau des candidats. La formation
          est constituée de 7 parties : programmation Python, limites des bases de données relationnelles, algèbre, analyse, probabilités,
          statistiques et un exemple de classifieur, le Perceptron.
          Elle est organisée en 7 semaines, un quiz valide les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet valide
          l’ensemble du MOOC.
                OBJECTIFS
          Développer des applications de base de traitement de données en Python. Utiliser les concepts d’algèbre, d’analyse et de statistiques
          nécessaires aux sciences des données. Identifier les défis liés au stockage et au calcul distribué.
                PRÉREQUIS                                INTERVENANTS
          Bases en mathématiques et en algorithmique (niveau    Stéphan CLÉMENÇON                  Joseph SALMON
          L2 validé)                                     Professeur au département Image,      Enseignant-chercheur au
                                                              Données, Signal de Télécom   département Image, Données,
                                                                             ParisTech      Signal de Télécom ParisTech
                                                                   Pierre SENELLART           Alexandre GRAMFORT
                                                              Professeur à l’Ecole Normale         Chercheur à l’INRIA
                                                                            Supérieure
                                                                                                       Ons JELASSI
                                                                     Anne SABOURIN           Enseignante à la formation
                                                                 Enseignant-chercheur au   continue de Télécom ParisTech,
                                                            département Image, Données,         coordinatrice du MOOC
                                                              Signal de Télécom ParisTech
                PROGRAMME
          Semaine 0 :                         Semaine 3 :                        Semaine 5 :
            ƒ                                  ƒ                                   ƒ
                                                 Python Partie 3
                                                                                    Statistiques
             Introduction générale
                                                 Probabilités Partie 1
                                                                                    Présentation du mini-projet
          Semaine 1 :                          ƒ                                   ƒ
                                                 Analyse Partie 1

            ƒ Python Partie 1                  ƒ                                 Semaine 6 :
                                                                                    Classifieur Perceptron
            ƒ                                 Semaine 4 :                          ƒ
             Algèbre Partie 1
                                                 Probabilités Partie 2
          Semaine 2 :                          ƒ

             Limites des bases de données
            ƒ                                  ƒ Analyse Partie 2
             relationnelles
             Python Partie 2
            ƒ
            ƒ
             Algèbre Partie 2











   64                                      contact@telecom-evolution.fr        web www.telecom-evolution.fr
   61   62   63   64   65   66   67   68   69   70   71