Page 62 - Télécom Evolution Catalogue 2018
P. 62
CES DATA SCIENTIST
DATA SCIENCE : ANALYSE ET GESTION DE GRANDES MASSES DE DONNÉES
Certificat
FL9BD01
délivré par DATES
Durée : 26 jours Début de formation : Octobre 2018
soit 182 heures Fin de formation : Octobre 2019
à Paris
Tarif : 10900 €
OBJECTIFS
• Mettre en œuvre les techniques récentes de gestion et d’analyse de grandes masses de données, pour exercer le métier de « data
scientist »
• Identifier et prendre en compte les différents formats des données, modèles, méthodes d’extraction de descripteurs (features)
structurels et sémantiques
• Utiliser et adapter les algorithmes de prédiction et les techniques d’analyse des données et d’apprentissage statistique
• Prendre en compte les problématiques de volumétrie et mettre en œuvre les techniques de passage à l’échelle
BIG DATA Nous assistons depuis plus d’une dizaine d’années à un véritable « déluge de données ». Les avancées technologiques récentes,
PRÉSENTATION GÉNÉRALE
la numérisation et la diversification des modes de collecte de données (web, réseaux sociaux tels Facebook ou Twitter, téléphones
mobiles, vidéo, etc.), permettent aujourd’hui de stocker des quantités massives d’observations dans des « entrepôts » de données
parfois gigantesques, de façon distribuée. Ces données sont actualisées de plus en plus souvent en « temps réel ».
Dans de nombreux secteurs d’activité, des investissements considérables ont été réalisés (finance, internet, CRM, biologie, médecine
individualisée, télécoms, e-commerce, grande distribution, sécurité, industrie high-tech) pour conduire à cette nouvelle ère
technologique de l’information.
Le phénomène « big data » est aujourd’hui perçu comme une tendance de fond, aux conséquences sociétales et économiques
considérables. Le déploiement généralisé de plates-formes Hadoop permettant l’analyse de données massives non structurées,
la mise sur le marché de solutions dédiées à ces analyses par les éditeurs de logiciel majeurs, le phénomène Open Data, le
développement du « cloud » et le succès de sociétés nouvelles dont l’activité repose précisément sur l’exploitation des flux de
données de trafic web, indiquent qu’une mutation est en train de se produire. Cette mutation appelle de nouveaux programmes de
formation, interdisciplinaires, intégrant toutes les facettes du métier de « data scientist » et permettant d’affronter les challenges
posés par le « big data » : infrastructure informatique, données, algorithmique, statistique.
RESPONSABLES
Florence D’ALCHE-BUC Fabian SUCHANEK
Professeur au sein du Département « Image, Données et Professeur à Télécom ParisTech. Il a fait ses recherches à
Signal » de Télécom ParisTech, elle consacre ses recherches à l’Institut Max Planck en Allemagne, chez Microsoft Research
l’apprentissage statistique à partir de données structurées et / Cambridge / UK, chez Microsoft Research Silicon Valley / USA,
ou temporelles, la modélisation de systèmes dynamiques et à et à l’INRIA Saclay. Il est l’auteur principal de YAGO, une des
la prédiction de liens dans les réseaux. plus grandes bases de connaissances publiques dans le monde.
PARTICIPANTS CONCERNÉS ET PRÉREQUIS
Cette formation s’adresse à des ingénieurs, techniciens, chefs de projet avec des bonnes connaissances en mathématiques
(probabilités, optimisation) et une bonne expérience de la programmation, souhaitant développer leurs compétences dans le
domaine de la gestion et l’analyse statistique des données massives.
De bonnes connaissances en mathématiques (optimisation, probabilités / statistique, algèbre linéaire) et une bonne expérience de la
programmation sont indispensables pour suivre avec profit cette formation (voir MOOC Fondamentaux pour Big Data).
CONDITIONS DE PARTICIPATION
Dossier de candidature incluant l’attestation de suivi du MOOC « Fondamentaux pour le big data » et entretien individuel pour valider
le projet professionnel.
ÉVALUATION ET CERTIFICATION
Contrôle des acquis au travers de QCM, de travaux pratiques et d’un projet en entreprise permettant la rédaction d’un mémoire
professionnel.
Le Certificat d’Etudes Spécialisées « Data Scientist » de Télécom ParisTech est délivré après validation des contrôles de connaissances
et du mémoire professionnel présenté oralement devant un jury.
60 contact@telecom-evolution.fr web www.telecom-evolution.fr