next up previous
Next: Synthèse Up: No Title Previous: No Title

Analyse

Les méthodes d'analyse que nous développons depuis quelques années portent surtout sur la source vocale. Par source vocale, il faut entendre ici l'activité glottique (la source de voisement) et les sources de bruit dans la voix. La source est responsable dans une large mesure de la qualité vocale. Un autre aspect important de l'analyse de la source est l'analyse prosodique, qui véhicule une quantité importante d'informations linguistiques et non-linguistiques.

Pour les aspects prosodiques, nous avons développé une méthode d'analyse des instants de fermeture glottique fondée sur la transformée en ondelettes (voir double page ``Détection robuste des fermetures glottiques par transformée en ondelettes''). Un algorithme de suivi des maxima de la transformée en ondelette à travers les échelles permet de dégager des lignes principales qui représentent les périodes glottiques. On peut ainsi trouver les instants de fermeture glottique, de façon robuste pour les divers styles de parole, en suivant ces lignes dans le plan temps-échelle. Cette méthode est évaluée en utilisant un signal électroglottographique de référence, enregistré simultanément au signal acoustique.

Les paramètres du signal d'onde de débit glottique ont été étudiés à travers la modélisation spectrale. Quatre paramètres essentiels de l'onde glottique ont été retenus : la période fondamentale, le quotient d'ouverture, l'amplitude, la vitesse de fermeture. Du point de vue spectral, cela correspond à la fréquence fondamentale, au maximum spectral, à l'amplitude et à la pente spectrale de la source. Un autre paramètre, plus global est le rapport entre composante périodique et composante apériodique dans la source.

Nos travaux portent actuellement sur le quotient d'ouverture glottique (rapport de la période ouverte de la glotte à la période fondamentale de voisement), en voix parlée et chantée. Le signal électroglottographique sert encore une fois de référence, afin de prendre des mesures de ce quotient et d'étudier ses variations dans la parole et le chant (voir page de présentation ``Mesure et estimation du quotient d'ouverture glottique dans la voix parlée et chantée''). Deux bases de données ont été enregistrées : une pour l'étude de l'effort vocal, avec un étalonnage précis du niveau sonore, et des voix très variées; la seconde, toujours en cours d'enregistrement porte sur des chanteurs professionnels. Cette étude est en collaboration avec le Laboratoire d'Acoustique Musicale de Paris VI.

Les études menées en collaboration avec l'Université La Sapienza de Rome sur le corpus CORENC, qui comprend des voyelles du français prononcées par divers locuteurs, selon divers degrés d'effort vocal, ont permis de mettre en évidence un certain nombre d'effets acoustiques de l'effort vocal : augmentation de la fréquence fondamentale d'environ 5 Hz par dB, augmentation de la fréquence du premier formant d'environ 3,5 Hz par dB, augmentation de la proportion de fréquences aiguës dans le spectre (pente spectrale).

Par ailleurs une méthode nouvelle d'étude de ce même facteur a été élaborée; elle repose sur la mise en correspondance de deux séquences de parole (``morphing acoustique'', limité dans cette étude à des voyelles isolées) au moyen de la méthode PSOLA (Pitch Synchronous OverLap-Add). Une fois alignées, les deux séquences peuvent être comparées de manière précise, et les différences peuvent être attribuées au facteur mis à l'étude, ou encore une voix peut être resynthétisée avec les caractères spectraux de l'autre voix.

En analyse du signal, une recherche bibliographique exhaustive sur l'analyse du signal vocal par des méthodes temps-fréquence se poursuit.


next up previous
Next: Synthèse Up: No Title Previous: No Title
rapporta
2000-06-30