Page 77 - Télécom Evolution Catalogue 2018
P. 77
TEXT MINING
DATES & LIEUX FC9BD10
14 au 15 décembre 2017 à Paris 2 jours
11 au 12 juin 2018 à Paris
1370 €
3 au 4 décembre 2018 à Paris
OBJECTIFS ET PRÉSENTATION
Développer et gérer des outils de traitement de langue utilisant les techniques de linguistique. Concevoir un système selon les
besoins spécifi ques d’un projet. Identifi er et utiliser les outils linguistiques de la distribution « Natural Language Toolkit » (sous
Python) et leurs interactions. Appliquer les méthodes de fouille de données à des données textuelles.
Le traitement automatique de langue et la fouille de texte (text-mining) pour extraire des informations de documents non structurés
est une source de données très importante pour les entreprises.
PARTICIPANTS ET PRÉREQUIS
BIG DATA
Ingénieurs, chefs de projet devant traiter des données textuelles.
Des connaissances du langage Python, quelques notions de grammaires formelles, de logique de premier ordre et de théorie des
probabilités (des rappels seront faits en cours) sont requises pour suivre cette formation avec profi t.
PROGRAMME
Comment fonctionne un lemmatiseur,
Introduction
Exemples et exercices
exemples et exercices Applications en fouille de texte
Linguistique computationnelle
Quand le lexique et la morphologie
Classifi cation supervisée de textes
ne suffi sent plus (syntaxe, (naïve Bayes, TF-IDF)
Introduction à la linguistique
sémantique)
La structure de NLTK, comment le
Extraction d'information (chunking,
Utilisation de grammaires hors
texte est géré, exemples et exercices détection d'entités nommées)
simples contexte à traits pour l'analyse
Synthèse et conclusion
Algorithmes fréquentiels de
syntaxique
désambiguïsation de mots
Utilisation de la logique de premier
(n-grammes, etc.) ordre pour l'extraction du sens à
partir de l'arbre syntaxique
MODALITÉS PÉDAGOGIQUES RESPONSABLE
La formation comprend des travaux pratiques qui Yannis HARALAMBOUS
permettent d’appliquer les notions abordées. Directeur d’études à IMT
Atlantique. Ses domaines
d’enseignement et de recherche
portent sur le traitement
automatique de la langue, la
fouille de texte, les langages
contrôlés / hybrides, le
document électronique et
l’internationalisation.
contact@telecom-evolution.fr web www.telecom-evolution.fr 75