Page 77 - Télécom Evolution Catalogue 2018
P. 77

TEXT MINING



         DATES & LIEUX                                                                                FC9BD10
         14 au 15 décembre 2017 à Paris                                                                 2 jours
         11 au 12 juin 2018 à Paris
                                                                                                        1370 €
         3 au 4 décembre 2018 à Paris


              OBJECTIFS ET PRÉSENTATION
        Développer et gérer des outils de traitement de langue utilisant les techniques de linguistique. Concevoir un système selon les
        besoins spécifi ques d’un projet. Identifi er et utiliser les outils linguistiques de la distribution « Natural Language Toolkit » (sous
        Python) et leurs interactions. Appliquer les méthodes de fouille de données à des données textuelles.

        Le traitement automatique de langue et la fouille de texte (text-mining) pour extraire des informations de documents non structurés
        est une source de données très importante pour les entreprises.
              PARTICIPANTS ET PRÉREQUIS
                                                                                                                    BIG DATA
        Ingénieurs, chefs de projet devant traiter des données textuelles.
        Des connaissances du langage Python, quelques notions de grammaires formelles, de logique de premier ordre et de théorie des
        probabilités (des rappels seront faits en cours) sont requises pour suivre cette formation avec profi t.
              PROGRAMME
                                                Comment fonctionne un lemmatiseur,
        Introduction                         ƒ                                  ƒ
                                                                                 Exemples et exercices
                                              exemples et exercices               Applications en fouille de texte
          Linguistique computationnelle      ƒ                                  ƒ
                                                Quand le lexique et la morphologie
                                                                                     Classifi cation supervisée de textes
          ƒ                                   ne suffi  sent plus (syntaxe,      (naïve Bayes, TF-IDF)
               Introduction à la linguistique
          ƒ                                   sémantique)                       ƒ
             La structure de NLTK, comment le
                                                                                   Extraction d'information (chunking,
                                                Utilisation de grammaires hors
           texte est géré, exemples et exercices   ƒ                             détection d'entités nommées)
           simples                            contexte à traits pour l'analyse   ƒ
                                                                                   Synthèse et conclusion
             Algorithmes fréquentiels de
          ƒ                                   syntaxique
           désambiguïsation de mots          ƒ
                                                Utilisation de la logique de premier
           (n-grammes, etc.)                  ordre pour l'extraction du sens à
                                              partir de l'arbre syntaxique





















              MODALITÉS PÉDAGOGIQUES                                                              RESPONSABLE
        La formation comprend des travaux pratiques qui                                   Yannis HARALAMBOUS
        permettent d’appliquer les notions abordées.                                        Directeur d’études à IMT
                                                                                            Atlantique. Ses domaines
                                                                                      d’enseignement et de recherche
                                                                                            portent sur le traitement
                                                                                         automatique de la langue, la
                                                                                          fouille de texte, les langages
                                                                                              contrôlés / hybrides, le
                                                                                           document électronique et
                                                                                                l’internationalisation.







                                              contact@telecom-evolution.fr       web www.telecom-evolution.fr       75
   72   73   74   75   76   77   78   79   80   81   82