Page 76 - Télécom Evolution Catalogue 2018
P. 76
EXTRACTION D’INFORMATIONS DU WEB
FC9BD07 DATES & LIEUX
2 jours 27 au 28 novembre 2017 à Paris
26 au 27 novembre 2018 à Paris
1370 €
OBJECTIFS ET PRÉSENTATION
Mettre en œuvre les solutions de la représentation des connaissances. Utiliser et adapter les algorithmes les plus importants
d’extraction d’informations.
L’extraction d’informations est la science de transformer les documents textuels du Web en informations structurées qui peuvent
être comprises par l’ordinateur. Elle sert notamment à construire des bases de connaissances, qui sont appliquées dans les moteurs
de recherche et les assistants intelligents.
Un moteur de recherche permet de trouver des pages Web à partir des mots clés. Avec des entreprises comme Google, Microsoft,
et Baidu, la recherche est un marché de plusieurs milliards d’euros par an.
BIG DATA Ingénieurs, chefs de projet, data scientists, intéressés par les moteurs de recherche et l’extraction de données du web.
PARTICIPANTS ET PRÉREQUIS
Des connaissances de base en programmation (Python), et en logique sont requises pour suivre cette formation.
PROGRAMME
Algorithmes de traitement de texte
Introduction Extraction des instances
à l'échelle
Set Expansion
Représentation des connaissances
Evaluation
Patterns de Hearst
Représentation des entités
Evaluation des résultats d'un Extraction des faits
Représentation des classes
algorithme
Principe itératif de DIPRE
Représentation du monde réel
Design de méthodes d'extraction
Représentation sous forme de
Web sémantique
graphe d'information
RDF
Reconnaissance d'entités nommées Désambiguation
RDFS
Prior
URI
Expressions régulières
Similarité
Synthèse et conclusion
Structures de données
Cohérence
RESPONSABLE MODALITÉS PÉDAGOGIQUES
Fabian SUCHANEK La résolution d’un problème concret d’extraction
Professeur à Télécom ParisTech. d’informations est mise en œuvre au cours de travaux
Il a fait ses recherches à l’Institut pratiques.
Max Planck en Allemagne, chez
Microsoft Research Cambridge /
UK, chez Microsoft Research
Silicon Valley/USA, et à l’INRIA
Saclay. Il est l’auteur principal de
YAGO, une des plus grandes bases
de connaissances publiques dans
le monde.
74 contact@telecom-evolution.fr web www.telecom-evolution.fr