_____________________
J.-S. Liénard, M.-G. Di Benedetto
Objet
La présente étude vise à préciser l'influence de la force de voix sur les paramètres acoustiques de la parole, tels que la fréquence fondamentale et la fréquence et l'amplitude des trois premiers formants des voyelles.
Description
Le signal de parole ne convoie pas seulement de l'information linguistique, c'est-à-dire une information relative aux phonèmes, aux mots, à la syntaxe, mais aussi de l'information non-linguistique, liée à la personne du locuteur et à la situation dans laquelle il se trouve par rapport à l'interlocuteur. L'information non-linguistique contribue elle aussi à l'élaboration du sens du message parlé. Le problème est qu'au niveau du signal les deux types d'information sont mélangés. L'information non- linguistique se trouve en grande partie dans les variations perceptibles du signal, à contenu linguistique constant. La variabilité du signal de parole, qui en rend si difficile la reconnaissance automatique, est pour l'essentiel un phénomène artificiel, qui se manifeste quand on cherche dans le signal uniquement des invariants de nature linguistique [1]. Il convient donc de s'intéresser non seulement à la perception de la parole mais aussi à celle de la voix, qui en est le support [2].
Dans cette perspective il est important d'identifier les principales sources de variation du signal. Parmi celles-ci figure la force de voix, ou effort vocal, qui reflète l'adaptation du locuteur à la distance à laquelle se trouve l'auditeur, ainsi qu'aux conditions de bruit ambiantes. On parle plus fort quand on sait l'auditeur éloigné de plusieurs mètres, ou quand on sait que le bruit ambiant risque de le gêner. On parle moins fort quand il se trouve très proche. Cette régulation largement inconsciente porte couramment sur une vingtaine de décibels, ce qui est considérable, sans même changer de type de voix, c'est-à-dire sans passer à une voix criée ou chuchotée. L'augmentation de l'effort vocal entraîne de nombreuses distorsions du signal, sous tous ses aspects: fréquence fondamentale, fréquence et intensité des formants, durée des sons, timbre. La présente étude a pour but de préciser ces effets, en se limitant au cas des voyelles.
Résultats et perspectives
Les voyelles orales du français ont été prononcées par divers locuteurs, masculins et féminins, dans plusieurs conditions d'éloignement entre l'opérateur et le locuteur (P proche, N normal, L éloigné), induisant diverses forces de voix chez ce dernier. Une étude perceptive a permis de s'assurer que les voyelles produites étaient intelligibles, ainsi que les caractéristiques de la voix (genre du locuteur, force de voix). Une étude acoustique a permis de montrer que les fréquences F0 et F1 augmentent parallèlement d'environ 4 Hz par décibel (Fig 1), et que le niveau relatif de la partie haute du spectre (pente spectrale) augmente avec la force de voix.
Références
[1] J.S. Liénard: "From speech variability to pattern processing:
a non-reductive view of speech
processing", in Levels in Speech Communication: Relations and Interactions,
C. Sorin et al. (editors), Elseviers
Science, 1995.
[2] J.S. Liénard: "Speech and voice perception: beyond pattern recognition",
in Speech Processing,
Recognition and Artificial Neural Networks, A. Esposito et al.
(Editors), Springer Verlag, 1999 (in press).
[3] J.S.Liénard and M.G. Di Benedetto: "Effect of vocal effort on spectral
properties of vowels", submitted
to the Journal of the Acoustical Society of America, 1998. (in revision).
Gpe Traitement du Langage Parlé |
| Dpt CHM |
|
Sommaire
|
| Présentation |
|
---|