TRANSCRIPTION GRAPHÈME-PHONÈME

Approches par Règles et par Modèles Probabilistes

_______________________

P. BOULA DE MAREUIL, W. MINKER

Figure

Objet

La conversion graphème-phonème peut servir à de nombreuses applications, parmi lesquelles on peut citer la synthèse vocale à partir du texte, bien sûr, ou la construction d'un dictionnaire pour la reconnaissance de la parole. L'objet de la recherche engagée dans ce domaine est de développer des outils pour la conversion qui soient à la fois performants, flexibles et portables vers d'autres langues.

Contenu

Pour la conversion graphème-phonème, deux approches complémentaires sont proposées, celles par règles et par modèles probabilistes.

Depuis 1980, le LIMSI dispose d'un programme de conversion graphème-phonème pour le français, GRAPHON, reposant sur un dictionnaire où règles et exceptions apparaissent sous un même format: celui des règles de réécriture contextuelles (1). Le système a été récemment modifié : il compte aujourd'hui plus de 2 000 règles, soit près du double par rapport à la version initiale. L'accent a été mis sur les ambiguïtés morpho-phonologiques du français, sur les liaisons, et, en marge de ce phénomène, sur le h disjonctif et la prononciation des nombres qui varie en fonction du contexte droit (2). Les signes non alpha-numériques, les nombres ordinaux, décimaux, écrits en chiffres romains, les sigles (3) et autres abréviations sont prétraités en amont - les abréviations sont remplacées par leur signification, quand celle-ci est connue et non ambiguë, ou épelées quand elles ne contiennent pas de voyelle. Les noms propres posent un problème complexe, car leur prononciation dépend fortement de leur origine et de l'usage.

Un effort de recherche complémentaire dans ce domaine repose sur une approche purement probabiliste pour la conversion, dont le but est d'identifer la chaîne phonétique la plus probable à partir de la séquence graphémique donnée en entrée (4). Contrairement à l'approche par règles, où un expert humain décrit ces règles en s'appuyant sur un grand nombre de données, l'apprentissage pour l'approche probabiliste est automatique et il peut ainsi servir comme un outil pour la phonémisation de nouvelles langues. Pour le modèle markovien utilisé, différentes topologies ont été étudiées, afin de modéliser les phonèmes de manière optimale. Les observations, qui représentent les graphèmes, sont contextuelles. Le système statistique ainsi développé pour le français a été facilement porté en allemand, le corpus de développement étant constitué de 22 654 transcriptions pour le français et 60 263 pour l'allemand.

Situation

Appliqué sur un texte contenant 33 647 mots, GRAPHON fournit un résultat de 99,8 % de mots correctement transcrits. Les deux systèmes on été évalués en français, sur une même liste de 1 000 mots isolés, extraits aléatoirement des 20 000 mots les plus fréquents du journal Le Monde. GRAPHON donne 99,1% de mots correctement transcrits face à 83,5% pour le module probabiliste. Les erreurs principales produites par la conversion statistique viennent de ce que le contexte immédiat d'un graphème ne suffit pas à déterminer sa transcription phonémique (ex. créatif vs création). Celles de GRAPHON proviennent essentiellement des mots d'origine étrangère. Il est envisageable d'appliquer l'approche statistique au problème des noms propres, étant donnée une quantité suffisante de transcriptions, et de combiner ainsi les deux systèmes pour augmenter les performances.

Références

(1) B. Prouts : "Contribution à la synthèse de la parole à partir du texte, transcription graphème-phonème en temps réel sur microprocesseur", Thèse de Docteur-Ingénieur, Université de Paris XI, Orsay, 1980.

(2) Ph. Boula de Mareüil : "Conversion graphème-phonème : en marge de la syllabation et de la liaison", 1ères Rencontres de Jeunes Chercheurs sur la Parole, Paris, novembre 1995.

(3) Ph. Boula de Mareüil: "Vers la phonématisation automatique des sigles", La linguistique, Vol. 31, Fasc. 1, 1995.

(4) W. Minker : "Grapheme-to-Phoneme Conversion - An Approach Based on Hidden Markov Models", Technical Report 9604, LIMSI-CNRS, Jan. 1996. Notes et Documents LIMSI.

Gpe Traitement du Langage Parlé

DptCHM

+ Sommaire

Présentation