Stratégies pour les systèmes de dialogue oral

_____________________

S. Rosset, S. Bennacef, L. Lamel

Figure

Objet

Le choix de la stratégie de dialogue a un double impact : sur la conception du système et sur la perception du système par l'utilisateur [1]. Par ``stratégie de dialogue'', nous nous référons à la fois aux types d'interactions entre système et utilisateur et aux moyens d'enchaîner ces interactions au cours du temps. La stratégie de dialogue dépend des caractéristiques et fonctionnalités voulues pour le système et doit prendre en compte les contraintes spécifiques au dialogue oral que sont le traitement interactif de parole spontanée et la prise en compte d'erreurs de reconnaissance.

Description

Nos objectifs sont d'obtenir un taux élevé de succès de dialogue avec une structure de dialogue très ouverte, laissant l'utilisateur libre de s'exprimer comme il le souhaite. Différentes stratégies ont été explorées dans le projet LE-3 ARISE concernant les informations ferroviaires par téléphone. Le gestionnaire de dialogue repose sur un ensemble de stratégies qu'on peut séparer en trois classes : 1) les stratégies dépendantes de choix ergonomiques, 2) les stratégies motivées par des choix en matière de métacommunication et 3) les stratégies dépendantes de la tâche. Le premier type de stratégies fait référence à des facteurs ergonomiques déterminants pour la facilité d'utilisation du système. Les facteurs les plus importants sont l'initiative (c'est-à-dire qui de l'utilisateur ou du système ``dirige'' le dialogue), la négociation et la navigation. Le second type de stratégies s'intéresse au déroulement global du dialogue. Pour ARISE, cela concerne tout particulièrement l'identification (ou changement) de (sous-)tâches et la détection d'erreurs provenant de la reconnaissance et de l'interprétation littérale. Ce type de stratégie est fondé notamment sur les historiques du dialogue et l'état du dialogue. Lors de la conception du système les deux premières classes de stratégies sont fortement interdépendantes. Le troisième type de stratégies repose sur les fonctionnalités (dépendantes des tâches) et les capacités du système. La mise en \oeuvre des différentes classes de stratégies implique des décisions sur l'architecture du système.

En ce qui concerne la structure du dialogue, différentes phases ont été identifiées : acquisition, négociation, navigation, acceptation a posteriori et méta-communication. Le système utilise et maintient à jour différentes sources de connaissance (historique des échanges système-utilisateur, historique du dialogue à long terme et modèle de la tâche) et infère à partir de là un état du dialogue. C'est en s'appuyant sur ces connaissances et l'état du dialogue que, selon la phase, le gestionnaire traite le schéma reçu de l'interprétation littérale et prend la décision stratégique appropriée (voir Fig. 1), comme par exemple le passage à un mode de dialogue contraint et dirigé afin de récupérer une erreur. La Fig. 2 montre le taux de réussite du dialogue en fonction du taux d'erreur de reconnaissance. Les travaux récents sur les stratégies de dialogue en fonction de l'interprétation contextuelle ont permis un gain significatif de ce taux de réussite.

Résultats et perspectives

Un corpus de plus de 3700 appels a été utilisé pour développer et tester les stratégies de dialogue. Le système a été régulièrement évalué par la SNCF. La dernière évaluation a permis de montrer une amélioration globale du taux de réussite du dialogue (de 53% à 85%). Le tableau 1 montre, sur un ensemble de 109 dialogues, le nombre de requêtes avec un changement de tâches et le nombre de fois où le changement portait sur le tarif, la réservation ou les services. Le gain est particulièrement significatif sur la détection de la tâche pour les demandes de tarif.

Références

[1] S. Rosset, S. Bennacef, L. Lamel: ``Design strategies for spoken dialog systems'',Eurospeech'99.
[2] L.Lamel et al.: ``The LIMSI ARISE System'', IVTTA'98.

Gpe Traitement du Langage Parlé

Dpt CHM

+ Sommaire

Présentation