Page 194 - Télécom Evolution Catalogue 2018
P. 194
TRAITEMENT DE LA PAROLE
FC9AM08 DATES & LIEUX
3 jours 27 au 29 novembre 2017 à Paris
28 au 30 novembre 2018 à Paris
1880 €
OBJECTIFS ET PRÉSENTATION
A l’issue de cette formation, les participants seront capables de lister l’ensemble des nouvelles technologies vocales, de décrire les
principes et les algorithmes de codage bas débit de la parole et ses applications aux radio-téléphones, de décrire les principes et
les diff érentes approches de la reconnaissance de la parole (reconnaissance robuste multilocuteurs, grands vocabulaires, dialogue)
et de la synthèse de parole à partir du texte et enfi n, d’aborder des formations (ou lire des ouvrages) plus spécialisées, tant dans le
domaine du codage que dans ceux de la synthèse et de la reconnaissance de parole.
L’objet de cette formation est de donner une vue d’ensemble des nouvelles technologies vocales et de leurs applications potentielles.
Trois domaines sont abordés : le codage bas-débit du signal de parole (et ses applications aux radio-téléphones), la reconnaissance
de la parole (reconnaissance robuste multilocuteurs, grands vocabulaires, dialogue) et la synthèse de parole à partir du texte.
PARTICIPANTS ET PRÉREQUIS
Ingénieurs et techniciens développant ou utilisant des systèmes qui intègrent tous types de facilités vocales : radiomobiles,
messageries et interfaces homme-machine.
Des connaissances de base en traitement du signal numérique sont souhaitables pour tirer un profi t maximum de cette formation.
PROGRAMME
Architecture d'un système de
Introduction aux technologies vocales
Architectures types
synthèse
Paramétrisation
Bases de traitement de parole
Alignement temporel et
Analyse syntaxique, transcription
Production (Larynx, conduit vocal
orthographique / phonétique, programmation dynamique
appareil respiratoire…) modèles pour l'intonation (prosodie)
Introduction aux modèles de
Classifi cation des sons (notions de
Synthèse acoustique (synthèse par
Markov: chaînes de Markov, densités
phonétique) règles ou par formants, synthèse par discrètes / continues, algorithmes de
Perception des sons de parole
concaténation d'unités acoustiques, Viterbi et de Baum Welsh
(perception, description acoustique, techniques de modifi cation de
Application à la reconnaissance de
spectrogrammes, triangle vocalique, paramètres prosodiques de la voix) parole: reconnaissance par mots, par
formants…) phonèmes, interface avec lexique,
Applications de la synthèse
Codage de parole Reconnaissance de la parole syntaxe
Codage de parole à haut débit:
Dialogue vocal et applications
Introduction et positionnement du
principes généraux, codage de problème (variabilité, sensibilité au
Introduction au dialogue vocal
forme d'onde, codage paramétrique bruit…)
Voice XML
normalisation
Approches pour la reconnaissance
Applications (dictée vocale, serveurs
Introduction au codage de source
automatique de parole (approches vocaux interactifs…)
Analyse du signal vocal
basées sur les connaissances, Synthèse et conclusion
Synthèse de la parole à partir du texte approches d'intelligence artifi cielle,
approches statistiques)
Petit historique de la synthèse
AUDIOVISUEL ET MULTIMÉDIA
RESPONSABLE
Chloé CLAVEL
Enseignant-chercheur à Télécom
ParisTech. Ses activité s de recherche
appartiennent au domaine de
l’Aff ective Computing. Elle a
précédemment travaillé en tant
que chercheuse à Thales Research
and Technology puis à EDF R&D.
Ses travaux concernant l’analyse
et le traitement de la parole et
plus particulièrement de la parole
émotionnelle ont notamment é té
abordé s dans un contexte applicatif
de gestion de la relation client sur
des corpus riches en expressions
spontanées (transcriptions manuelles
et automatiques des centres
d’appels, etc.).
192 contact@telecom-evolution.fr web www.telecom-evolution.fr