____________________
C. D'ALESSANDRO, G. RICHARD, B. YEGNANARAYANA, V. DARSINOS
Objet
L'objet de ce travail est :
1) de proposer un algorithme pour l'analyse des apériodicités dans la source vocale;
2) d'évaluer les performances de cet algorithme,
3) d'étudier son utilisation en synthèse de la parole.
Contenu
La source vocale est en grande partie responsable de la qualité vocale, et en particulier du mode de phonation. La théorie acoustique de production de la parole distingue le mode "voisé", lorsque les cordes vocales vibrent périodiquement, et le mode "non voisé", lorsqu'elles ne vibrent pas. En réalité, le voisement se combine souvent avec une émission de bruit lors de la phonation (bruit d'aspiration, bruit de frication, bruit structurel). On peut donc raffiner le modèle acoustique en considérant la source vocale comme la somme d'une composante périodique et d'une composante apériodique.
Pour l'analyse et la synthèse de la parole, il est important de caractériser cette composante apériodique. Ce fait est bien connu des phoniatres, en analyse de la voix. Nous avons mis au point un nouvel algorithme pour analyser la composante périodique et la composante apériodique de la parole. Cette méthode permet d'extraire la composante apériodique et la composante périodique, mais aussi de synthétiser séparement les deux composantes, éventuellement en les modifiant.
Une des motivations de ce nouvel algorithme était de mesurer sur des signaux naturels les deux composantes. L'algorithme a donc été soumis à une évaluation sur des signaux contrôlés. Les différentes sources d'apériodicités ont été analysées, et les performances de l'algorithme pour les différentes situations ont été mesurées. La méthode apparaît solide pour analyser des voix naturelles: les signaux obtenus par décomposition peuvent être reliés de manière fiable à la production de la parole.
La modification de la composante apériodique lors de la resynthèse permet de contrôler des paramètres acoustiques de la voix qui étaient jusqu'à présents inaccessibles, comme le taux de voisement et l'effort vocal. Une méthode originale de modification de cette composante est utilisée conjointement avec l'algorithme de séparation.
Situation
L'algorithme et ses propriétés sont décrits dans (1)(2). L'évaluation de l'algorithme est rapportée dans (3)(4). Les premières applications de cette décomposition à la synthèse de la parole sont décrites dans (5).
Références
(1) C. d'Alessandro, B. Yegnanarayana, and V. Darsinos :"Decomposition of speech signals into deterministic and stochastic components". In Int. Conf. on Acoust., Speech and Sig. Proc., ICASSP'95, pages 446--452.
(2) B. Yegnanarayana, C. d'Alessandro and V. Darsinos :"An iterative algorithm for decomposition of speech signals into periodic and aperiodic components". Rapport NDL 95-01, soumis pour publication.
(3) V. Darsinos, C. d'Alessandro, and B. Yegnanarayana :"Evaluation of a periodic/aperiodic speech decomposition algorithm.'' In European Conference on Speech Communication and Technology, EUROSPEECH'95, pages 393--396.
(4) C. d'Alessandro V. Darsinos and B.Yegnanarayana : "Significance of periodic and aperiodic decomposition for analysis of voice sources.'' Rapport NDL 95-2, soumis pour publication.
(5) G. Richard and C. d'Alessandro : "Modification of the aperiodic component of speech signals for synthesis.'' In R. Van Santen, R. Sproat, J. Hirschberg, and J. Olive, editors, Progress in Speech Synthesis. Springer Verlag, 1996 (sous presse).
Gpe Traitement du Langage Parlé |
| DptCHM |
|
Sommaire
|
| Présentation |
|
---|