ariantes de prononciation en français : e-muet et liaison

_____________________

M. Adda-Decker, L. Lamel, G. Adda

Figure

Objet

Le but de ce travail est d'étudier quantitativement des variantes de prononciation en français, notamment le e-muet et la liaison, variantes qui permettent de générer un nombre variable de phonèmes par mot. Ces variantes sont liées au style de parole et dépendent partiellement du milieu socio-culturel du locuteur. Dans cette étude, la comparaison des occurences du e-muet et des liaisons a été mesurée sur des grands corpus transcrits de parole lue (120 heures de BREF, journal LeMonde) et spontanée (35 heures de MASK, demande d'informations ferroviaires).

Description

La langue française permet de prononcer certaines consonnes finales, par défaut muettes, si le mot suivant commence par une voyelle ou un h muet (les_hommes). Ces liaisons ne se produisent a priori qu'à l'intérieur de syntagmes et sont plus fréquentes entre article et substantif qu'entre nom et adjectif par exemple. Des liaisons successives sont généralement évitées. Peu de sons sont concernés: /z/, /t/, /n/, /r/, /p/ correspondant aux caractères {<-s,-z,-x}, {-d,-t}, -n, -r, -p respectivement. Les plus fréquents, /z/ et /t/, sont liés aux pluriels d'articles, adjectifs, noms et verbes. Le e-muet, qui est plutôt un e-optionnel, est très souvent présent dans le signal acoustique. Cette voyelle, qui est aussi appelée schwa, peut apparaître en position faible en début et à l'intérieur d'un mot (devenir, ciseler), et fréquemment en fin de mot (le, drame).

Un système de reconnaissance de la parole peut servir d'outil pour l'étiquetage phonémique de grands corpus de parole [2]. Si le dictionnaire de prononciations utilisé par le système contient des variantes pertinentes par rapport aux corpus étudiés [3], l'étiquetage automatique de la parole permet alors de dégager des fréquences d'observations pour les différents types de variantes. Les résultats dépendent à la fois des variantes effectivement présentes dans les corpus et des caractéristiques du système utilisé. L'interprétation de ces résultats demande alors un double éclairage linguistique et technique. Des résultats comparatifs permettent de limiter l'impact technique.

Résultats et perspectives

A partir des résultats d'étiquetage automatique, nous avons quantifié les liaisons et les schwas pour la parole lue et spontanée [4]. Nous avons pu observer que les liaisons, qui nécessitent un lien grammatical étroit pour pouvoir se réaliser, se font plus facilement pour des mots fréquents, que pour des mots rares et que de manière générale la parole lue admet plus de liaisons (55%) que la parole spontanée (43%). Les taux sont calculés comme le rapport de liaisons observées sur le nombre de contextes de liaisons possibles. Concernant le schwa, quelques résultats et exemples comparant parole lue et spontanée sont montrés dans les Figures 1 et 2. Les schwas observés sont analysés en fonction de leur position dans le mot. En position finale ils se réalisent peu (20% lu/10% spontané) dans les mots polysyllabiques. Les schwas des mots monosyllabiques (97% lu/65% spontané) ont un taux de réalisation comparable mais légèrement inférieur aux schwas dans les syllabes initiales des mots polysyllabiques (98% lu/77% spontané). Globalement la parole lue produit plus de schwas (78%) que la parole spontanée (59%).

Références

[1] L.F. Lamel, J.-L. Gauvain, and M. Eskénazi : ``BREF, a Large Vocabulary Spoken Corpus for French'', Eurospeech, 1991.
[2] M. Adda-Decker, L. Lamel : ``Pronunciation Variants Across Systems, Languages and Speaking Style'', Speech Communication, 29, pp.83-99, 1999.
[3] L.F. Lamel, G. Adda : ``On Designing Pronunciation Lexicons for Large Vocabulary, Continuous Speech Recognition'', ICSLP, 1996.
[4] M. Adda-Decker, P. Boula de Mareüil, L. Lamel : ``Pronunciation Variants in French: schwa & liaison'', ICPhS, San Francisco 1999.

Gpe Traitement du Langage Parlé

Dpt CHM

+ Sommaire

Présentation