PERCEPTION TONALE ET SYNTHÈSE DE L'INTONATION

________________

C. D'ALESSANDRO, F. BEAUGENDRE, P. MERTENS, S. ROSSET, O. PIOT

Objet

L'objet de ce travail est l'analyse et la synthèse automatique de l'intonation. L'intonation est étudiée sous l'angle de la perception, afin de ne retenir ou de ne générer que les éléments pertinents dans le continuum mélodique. Ce travail comprend à la fois des expérimentations psychoacoustiques, des algorithmiques d'analyse intonative et des règles de synthèse.

Contenu

Les études menées sur l'intonation concernent à la fois l'analyse et la synthèse. Pour l'analyse, nous conduisons depuis plusieurs années des expériences en perception de hauteur tonale pour les sons de courte durée, comme les notes courtes en musique ou les tons syllabiques en parole. Le but de ces expériences et de mesurer la hauteur perçue par des sujets humains pour de nombreuses conditions expérimentales qui représentent les situations rencontrées en parole. La perception des glissandos mélodiques a été étudiée en détail. Il s'agit ensuite d'analyser et de modéliser les résultats obtenus avec les sujets, afin de construire un modèle fonctionnel. Un modèle numérique de la perception de l'intonation reste encore en grande partie à établir, mais les premiers éléments de ce travail systématique sont déjà acquis.

Une application pratique de la modélisation de l'intonation est l'analyse automatique de l'intonation par stylisation des courbes de fréquence fondamentale. Nous avons mis au point un système de stylisation automatique qui s'appuie sur la modélisation perceptive. L'algorithme utilise la connaissance des coupes syllabiques et l'intégration perceptive pour transformer une courbe intonative en suite de tons qui lui sont perceptivement équilavents. La description tonale est plus simple, et plus proche d'une description fonctionnelle de l'intonation. Ce système de stylisation a été comparé avec une stylisation manuelle des courbes intonatives. Les résultats de la comparaison sont favorables au système automatique.

Les études sur l'analyse de l'intonation sont complétées par l'écriture de règles de synthèse de l'intonation, utilisées dans le synthétiseur à partir du texte du laboratoire. De nouvelles règles ont été élaborées pour tenir compte des phénomènes prosodiques qui se produisent lorsque le débit de parole change (de normal à lent ou rapide). Le changement de débit affecte les pauses, l'accentuation, et la réalisation des mouvements prosodiques.

Situation

Une série d'expériences sur la perception de hauteur pour des tons syllabiques a été conduite (2). Un système de stylisation a été développé (1), et comparé à la stylisation manuelle (3). De nouvelles règles de synthèse ont été élaborées pour tenir compte des phénomènes prosodiques mis en jeu lorsque l'on parle avec différentes vitesses d'articulation (4).

Références

(1) C. d'Alessandro and P. Mertens. "Automatic pitch contour stylization using a model of tonal perception.'' Computer Speech and Language, 9(3):257--288, 1995.

(2) C. d'Alessandro, S. Rosset, and O. Piot. "Measurement of pitch perception for f0 glides.'' In European Conference on Speech Communication and Technology, EUROSPEECH'95, pages 957--96.

(3) P. Mertens, F. Beaugendre, and C. d'Alessandro. "Automatic stylization of intonation: application to speech synthesis.'' In R. Van Santen, R. Sproat, J. Hirschberg, and J. Olive, editors, Progress in Speech Synthesis. Springer Verlag, 1996 (in press).

(4) F. Beaugendre "Generating French intonation at different speaking rates'' In European Conference on Speech Communication and Technology, EUROSPEECH'95, pages 603--606.

Gpe Traitement du Langage Parlé

DptCHM

+ Sommaire

Présentation