Résumé

Cette thèse a été présentée et soutenue publiquement le 6 décembre 1999 pour l’obtention du Doctorat de l’[Université Henri Poincaré–Nancy I->http://www.uhp-nancy.fr/] par Bruno Mathieu Je remercie mon laboratoire d’accueil, le [LORIA->http://www.loria.fr], et en particulier [Yves Laprie->http://www.loria.fr/~laprie/] et [son équipe PAROLE->http://parole.loria.fr/]. L’objet de cette thèse est l’étude de la reconnaissance automatique de parole. Ce document débute avec une description des traitements acoustiques les plus répandus en vue de reconnaître la parole. Nous décrivons ensuite les diverses architectures qui ont été utilisées : comparaison dynamique de formes acoustiques, systèmes experts, réseaux neuro-mimétiques et modèles de Markov. Puis ce document se divise en deux parties. Dans une première expérience, nous nous sommes intéressés à la reconnaissance de mots. Pour cela, nous utilisons des automates qui modélisent le vocabulaire. Celui-ci comporte les dix chiffres anglo-saxons, dont deux prononciations différentes pour le zéro. Le corpus de parole TiDigits a été utilisé par d’autres laboratoires ce qui nous permet de comparer nos résultats. La première étape est consacrée à la reconnaissance de mots isolés. Puis nous présentons une méthode de segmentation de séquences de chiffres. La fin de ce chapitre est consacrée à la reconnaissance de mots enchaînés et à une discussion sur les mérites et les faiblesses de notre approche. La deuxième partie traite de l’utilisation d’un modèle de production qui pourrait être utilisé pour la reconnaissance de la parole. Nous commençons par présenter les équations acoustiques régissant l’écoulement de l’air dans le conduit vocal et divers modèles articulatoires. Ensuite nous justifions le choix du modèle articulatoire de Maeda. Nous décrivons comment nous avons adapté le modèle à un locuteur masculin. Puis nous présentons la méthode variationnelle utilisée pour retrouver les trajectoires des articulateurs en fonction de la parole prononcée. Une dernière section présente les logiciels réalisés. En conclusion, nous résumons les résultats obtenus et donnons quelques perspectives en vue de reconnaître la parole continue quel que soit le locuteur. Mots clef : reconnaissance de parole, modèles de production de parole, modèle de Maeda, inversion acoustique-articulatoire.

PS : je recherche un emploi dans les Vosges en informatique

Télécharger la thèse au format PDF comprimée


Sommaire de la thèse de Bruno MATHIEU présentée et soutenue publiquement le 6 décembre 1999