Mesure et estimation du quotient d'ouverture glottique dans la voix parlée et chantée

_____________________

N. Henrich, B. Doval, C. d'Alessandro

Figure

Objet

Dans le cadre d'une étude sur l'analyse et la perception de la source dans la voix parlée et chantée, on s'intéresse plus particulièrement au quotient d'ouverture glottique. Les travaux en cours portent sur le développement d'une méthode d'estimation spectrale de ce paramètre, ainsi que sur sa mesure expérimentale à partir de signaux électroglottographiques.

Description

Le quotient d'ouverture glottique Oq est défini comme le rapport de la durée d'ouverture glottique sur la période. Sur le plan perceptif, il influe sur le caractère tendu ou serré d'une voix : une voix relachée se caractérise généralement par un quotient d'ouverture élevé (donc proche de 1) et une voix tendue ou serrée par un quotient d'ouverture relativement faible.

Ce paramètre de source peut être estimé expérimentalement à l'aide d'un électroglottographe, qui mesure la résistance électrique de la glotte, donc son degré d'ouverture. En dérivant le signal électroglottographique, on obtient, pour chaque période, deux pics discernables et de sens opposé. Le pic le plus marqué correspond au moment de fermeture glottique, tandis que l'autre pic peut être relié à l'instant d'ouverture glottique. La détermination de ces deux instants permet alors de connaître la valeur du quotient d'ouverture (cf. figure 1). Des mesures de quotient d'ouverture ont ainsi été effectuées dans le cas de locuteurs et de chanteurs. Cette méthode a ses limites, car, dans le cas de la voix parlée, on observe souvent une indétermination du pic associé à l'ouverture glottique, ce qui peut entraîner une erreur de mesure sur Oq.

Les mesures électroglottographiques servent de référence dans les travaux menés sur l'estimation spectrale [1]. D'après une étude théorique [2], les basses fréquences de la source sont modélisées par un filtre anticausal passe-bas d'ordre 2. Les coefficients de ce filtre sont liés aux paramètres de source par des relations analytiques. Le but de l'estimation est de déterminer le filtre d'ordre 2 qui modélisera au mieux la source (cf. figure 4) et d'en déduire les valeurs, en particulier, du quotient d'ouverture. Cette estimation peut être réalisée par une prédiction linéaire d'ordre 2 appliquée au signal de source obtenu par filtrage inverse du signal acoustique.

Résultats et perspectives

Des enregistrements ont permis d'établir une base de données de signaux acoustiques et électroglottographiques, recueillis simultanément. Les signaux électroglotto- graphiques permettent d'étudier les variations du quotient d'ouverture en cours de phrase, en voix parlée et chantée [3]. On observe, en particulier, des différences notables de Oq lors de l'émission d'un même mot crié ou chanté, ce qui illustre l'effet perceptif d'effort vocal associé à Oq (cf. figure 2). Deux chanteurs de sexe différent, qui n'utilisent pas le même mode d'émission vocale, auront également des valeurs différentes de Oq sur une même phrase chantée, le mode 2 (voix de tête) se caractérisant par des valeurs de Oq plus élevées que le mode 1 (voix de poitrine) (cf. figure 3). La méthode d'estimation spectrale par prédiction linéaire semble sous-estimer les valeurs de Oq (cf. figure 5). D'autres méthodes d'estimation spectrale, et l'analyse de la corrélation entre les estimations spectrale et électroglottographique sont en cours d'étude. Cette étude est menée en collaboration avec Michèle Castellengo (Laboratoire d'Acoustique Musicale, Paris).

Références

[1] N. Henrich, B. Doval and C. d'Alessandro : ``Glottal open quotient estimation using linear prediction'' Proc. International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications, Firenze, septembre 1999.
[2] B. Doval and C. d'Alessandro : ``The spectrum of glottal flow models'' notes et documents LIMSI, 99 - 07, Mai 99, soumis pour publication.
[3] N. Henrich, B. Doval, C. d'Alessandro and M. Castellengo : ``Open quotient measurements on EGG, speech and singing signals'' Proc. International Workshop on Advances in Quantitative Laryngoscopy, Voice and Speech Research, Jena, avril 2000.

Gpe Traitement du Langage Parlé

Dpt CHM

+ Sommaire

Présentation