_____________________
Objet
Nous présentons une nouvelle méthode pour modifier la qualité vocale. Elle s'appuit sur une théorie spectrale de la source vocale. Un algorithme est proposé, à base de décomposition périodique-apériodique de la source et de traitement spectral, par transformée de Fourier à court terme.
Description
La modification de la source vocale est actuellement un enjeu important pour l'analyse et la synthèse de la parole. Le but de cette étude est de proposer des méthodes de modification paramétrique de la source vocale, pour des échantillons de parole enregistrés, sans condition particulière sur le type d'enregistrement ou de voix. Idéalement, on souhaiterait manipuler des paramètres globaux comme ``l'effort vocal'' ou bien ``la hauteur tonale'' (soit le corrélat perceptif des changements de fréquence fondamentale et de qualité vocale lorsque l'on parle avec plus ou moins de tension dans le larynx). Un but plus réaliste est de traiter des paramètres significatifs, mais de plus bas niveau, (par exemple la fréquence fondamentale du signal, le rapport périodique/apériodique dans la source vocale, le quotient d'ouverture de la glotte etc.). Nous pensons qu'il sera ensuite possible d'appliquer des règles pour piloter ces paramètres de bas niveau. Dans certain cas, c'est assez simple (par exemple baisser globalement l'effort vocal d'une phrase), alors que d'autres situations sont plus délicates.
Au contraire de la plupart des travaux récents sur la modélisation de la source, nous préférons travailler dans le domaine spectral. Un avantage du domaine spectral est qu'il n'exige pas pour l'enregistrement un matériel qualibré. Par exemple, une distorsion de phase est acceptable pour le traitement spectral, et problématique dans le domaine temporel. Un autre avantage est l'interprétation plus simple en termes spectraux de la description perceptuelle de la qualité vocale.
Les algorithmes utilisés pour modifier la qualité vocale sont: 1/ filtrage inverse adaptatif; 2/ décomposition périodique-apériodique de la source; 3/ modification des composantes périodiques et apériodiques; 4/ filtrage adaptatif de synthèse.
Résultats et perspectives
Les résultats expérimentaux démontrent la capacité du traitement spectral à modifier la qualité vocale. D'une part la représentation spectrale rend bien compte de la perception de qualité vocale, et d'autre part il existe des méthodes efficaces de traitement du signal dans le domaine spectral. Cependant, dans les expériences réalisées, l'intonation (F0 et durées) n'a pas été modifiée, alors que dans la parole réelle, qualité de voix et intonation varient toujours de façon coordonnée. De plus, les variations de qualité vocale sont perceptivement moins saillantes que les variations d'intonation. Il serait donc important de prendre en compte les covariations pour la synthèse de la parole.
Plusieurs applications de ce travail sont envisagées. Ces méthodes peuvent s'appliquer au pré-traitement de bases de données de signal pour la synthèse par concaténation. Il est également possible d'utiliser ces algorithmes pour implémenter des règles sur la source vocale, en vue de la synthèse paramétrique de la parole.
Référence
C. d'Alessandro, B. Doval, ``Voice quality modification using periodic-aperiodic decomposition and spectral processing of the voice source signal'', 3rd International Workshop on Speech Synthesis, pages 277-282, Jenolan Caves, novembre 1998. European Speech Communication Association.
Gpe Traitement du Langage Parlé |
| Dpt CHM |
|
Sommaire
|
| Présentation |
|
---|