Page 76 - Télécom Evolution Catalogue 2018
P. 76

EXTRACTION D’INFORMATIONS DU WEB


          FC9BD07                                                                                  DATES & LIEUX

           2 jours                                                                   27 au 28 novembre 2017 à Paris
                                                                                     26 au 27 novembre 2018 à Paris
           1370 €



                OBJECTIFS ET PRÉSENTATION
          Mettre en œuvre les solutions de la représentation des connaissances. Utiliser et adapter les algorithmes les plus importants
          d’extraction d’informations.

          L’extraction d’informations est la science de transformer les documents textuels du Web en informations structurées qui peuvent
          être comprises par l’ordinateur. Elle sert notamment à construire des bases de connaissances, qui sont appliquées dans les moteurs
          de recherche et les assistants intelligents.
          Un moteur de recherche permet de trouver des pages Web à partir des mots clés. Avec des entreprises comme Google, Microsoft,
          et Baidu, la recherche est un marché de plusieurs milliards d’euros par an.
      BIG DATA  Ingénieurs, chefs de projet, data scientists, intéressés par les moteurs de recherche et l’extraction de données du web.
                PARTICIPANTS ET PRÉREQUIS


          Des connaissances de base en programmation (Python), et en logique sont requises pour suivre cette formation.


                PROGRAMME
                                                   Algorithmes de traitement de texte
          Introduction                         ƒ                                   Extraction des instances
                                                 à l'échelle
                                                                                    Set Expansion
            Représentation des connaissances                                       ƒ
                                                Evaluation                         ƒ
                                                                                    Patterns de Hearst
             Représentation des entités
            ƒ                                        Evaluation des résultats d'un     Extraction des faits
               Représentation des classes
            ƒ                                  ƒ
                                                 algorithme
                                                                                    Principe itératif de DIPRE
               Représentation du monde réel
            ƒ                                      Design de méthodes d'extraction   ƒ
               Représentation sous forme de
            ƒ                                  ƒ                                   Web sémantique
             graphe                              d'information
                                                                                    RDF
            Reconnaissance d'entités nommées     Désambiguation                    ƒ ƒ
                                                                                    RDFS

                                                 Prior
                                                                                    URI
             Expressions régulières
            ƒ                                  ƒ                                   ƒ
                                                 Similarité
            ƒ                                  ƒ                                   Synthèse et conclusion
               Structures de données
                                                 Cohérence
                                               ƒ









          RESPONSABLE                                                        MODALITÉS PÉDAGOGIQUES
                     Fabian SUCHANEK                                   La résolution d’un problème concret d’extraction
             Professeur à Télécom ParisTech.                           d’informations est mise en œuvre au cours de travaux
            Il a fait ses recherches à l’Institut                      pratiques.
             Max Planck en Allemagne, chez
            Microsoft Research Cambridge /
               UK, chez Microsoft Research
              Silicon Valley/USA, et à l’INRIA
            Saclay. Il est l’auteur principal de
          YAGO, une des plus grandes bases
            de connaissances publiques dans
                              le monde.






   74                                      contact@telecom-evolution.fr        web www.telecom-evolution.fr
   71   72   73   74   75   76   77   78   79   80   81