_____________________
L. Lamel, S. Bennacef, J.L. Gauvain, S. Rosset, en collaboration avec B. Prouts, M. Garnier-Rizet*
Objet
L'un des objectifs du projet européen LE-3 ARISE (Automatic Railway Information Systems for Europe) est de développer un démonstrateur d'un serveur téléphonique d'informations ferroviaires pour les principales gares françaises. Ce travail s'appuie sur le système développé dans le cadre du projet LE-MLAP RAILTEL [1]. Une version multilingue français/anglais pour le TGV Paris-Londres est également en développement.
Description
Le démonstrateur délivre des informations sur les trajets ``grandes lignes'' à partir d'une base de données statique couvrant une période de 6 mois et contenant les horaires, les services à bord (restaurant, bar, couchette, etc.), les tarifs, et des informations relatives aux réductions. Le système est basé sur une architecture modulaire comprenant six principaux composants: 1) Un système de reconnaissance de parole continue (2000 mots) qui génère une transcription en temps réel; 2) Un module de compréhension qui produit un schéma sémantique pour chaque phrase reconnue; 3) Un système de dialogue à initiative partagée dont le but est de fournir l'information recherchée par l'utilisateur tout en assurant une communication aussi naturelle que possible; 4) Un module d'accès à la base de données qui génère des requêtes SQL à partir de schémas sémantiques; 5) Un module de génération qui produit une réponse en langage naturel à partir de l'information délivrée par la base de données, de l'état du dialogue, et de la requête de l'utilisateur. Ce module joue un rôle essentiel car toute l'information doit être délivrée sous forme vocale (contrairement au kiosque MASK[2]); 6) Un synthétiseur qui produit une parole très naturelle par concaténation de segments de parole de taille variable.
Résultats et perspectives
Par rapport à notre système RAILTEL, les principales améliorations concernent la gestion du dialogue, l'utilisation de mesures de confiance dans le système de reconnaissance, et la possibilité d'interrompre les réponses du système. Le dialogue a été amélioré à partir de l'analyse des stratégies utilisées par des opérateurs humains dans un contexte identique. Voici quelques unes des modifications apportées au système: - Les réponses sont plus courtes, ce qui permet à l'utilisateur de rester en contact étroit avec le système et rend le dialogue plus naturel. - La relaxation des contraintes de l'utilisateur permet de proposer un train dans la plupart des situations. - Les réponses de type oui/non sont maintenant proprement traitées ce qui permet au système d'utiliser des confirmations explicites. - Un mode épellation a été ajouté pour les noms de gares. - Les questions portant sur des fonctionalités non traitées actuellement quoique entrant dans le cadre de la tâche sont détectées et une réponse appropriée est fournie à l'utilisateur (ex: ``Je suis désolée mais vous ne pouvez pas réserver pour plus d'une personne'').
Cette nouvelle stratégie de dialogue est mieux perçue par les sujets qui testent le système et permet de réduire significativement le durée totale du dialogue.
Références
[1] S. Bennacef, L. Devillers, S. Rosset, L. Lamel (1996), ``Dialog in the
RAILTEL Telephone-Based System,'' Proc. ICSLP'96,
Philadelphia, PA, octobre.
[2] J.L. Gauvain, S. Bennacef, L. Devillers, L. Lamel, S. Rosset (1997),
``Spoken Language Component of the MASK Kiosk,'' K. Varghese et S. Pfleger, editors,
Human Comfort and Security of Information Systems,
Springer-Verlag.
(*) Société Vecsys, Courtaboeuf, France
Gpe Traitement du Langage Parlé |
| Dpt CHM |
|
Sommaire
|
| Présentation |
|
---|