Le système MASK : progrès et évaluation

_____________________

J.L. Gauvain, S. Bennacef, L. Lamel, J.J. Gangolf, en collaboration avec la direction de la recherche de la SNCF

Figure

Objet

Le but du projet Esprit MASK``Multimodal Multimedia Service Kiosk'' était de développer un kiosque d'information et de distribution avec une interface innovante et conviviale combinant les modalités tactiles et vocales [1].

Description

Le design du kiosque a été revu et d'importantes améliorations ont été apportées à l'interface utilisateur et à son architecture logicielle [2]. Les principales améliorations de l'interface concernent les points suivants : l'auto-présentation du système qui illustre l'utilisation du kiosque et explicite les différentes fonctionnalités offertes ; une interface plus intuitive avec une transition aisée entre les tâches (information/billet) ; le visage d'une guichetière qui reflète l'état du système (attente, écoute, réflexion, synthèse) (Figure 2) ; ainsi que l'utilisation de deux niveaux d'aide avec des temps de latence fixes.

Le bouton sous la guichetière virtuelle doit être utilisé pour s'adresser à la machine. Ce fonctionnement, qui simplifie le problème de détection de parole utile, a été accepté facilement par la plupart des utilisateurs. La liste des trains satisfaisant la demande de l'utilisateur est affichée à gauche de l'écran. L'utilisateur peut alors sélectionner un des trains en le désignant soit vocalement, par sa position dans la liste ou par son horaire, soit au moyen de l'écran tactile. La partie basse de l'écran ressemble à un billet de train et contient les informations acquises par le système. Dans l'exemple ci-contre, la requête de l'utilisateur est ``Je voudrais aller de Paris à Lyon, jeudi vers 14 heures''.

L'architecture du système est donnée en figure 3. Cette nouvelle architecture est une version modifiée de l'interface vocale originale après intégration de l'interface multimédia qui contrôle l'écran tactile. L'interaction entre l'interface multimédia et l'interface vocale se fait exclusivement à travers le gestionnaire de dialogue. Ces deux modalités d'entrée offrent des stratégies de dialogue différentes. La stratégie tactile s'apparente à de la commande où l'utilisateur doit fournir les informations nécessaires afin de passer à l'étape suivante, tandis que l'entrée vocale offre un dialogue à initiative partagée où l'utilisateur peut guider l'interaction ou être guidé par le système grâce aux messages d'aide.

Résultats et perspectives

Le kiosque a été évalué globalement auprès de 100 utilisateurs en gare Saint-Lazare pendant sept jours en avril 1998. Des évaluations complémentaires ont été menées avec 100 autres sujets afin de comparer différentes situations en contraste : comparaison des deux modalités (vocale et tactile), comparaison du kiosque MASK aux bornes de ventes actuelles, et comparaison des messages d'aide graphiques et vocaux. Chaque utilisateur a effectué quatre tâches de demande d'informations et a rempli un questionnaire d'utilisabilité. Le temps de transaction avec le kiosque MASK est réduit de 30% par rapport aux kiosques standards. Le taux de succès est de 85% pour les novices et de 94% pour ceux habitués au système (plus de 3 utilisations). Tous les objectifs fixés par la SNCF au début du projet ont été atteints par le prototype, qu'ils concernent le taux de succès, le temps de transaction, ou la satisfaction des utilisateurs. L'utilisation des deux modalités s'est avérée plus efficace (rapide et aisée) que l'une des deux, certaines actions étant clairement plus faciles à réaliser vocalement qu'avec l'écran tactile et vice-versa. Les sujets apprennent à exploiter l'entrée vocale en utilisant le système, et ils ont tendance à utiliser plus souvent le mode vocal lorsqu'ils sont familiarisés avec le kiosque.

Références

[1] J.L. Gauvain, S. Bennacef, L. Devillers, L. Lamel, S. Rosset, ``The Spoken Language Component of the MASK Kiosk,'' dans K. Varghese, S. Pfleger(Eds.) ``Human Comfort and security of information systems'', Springer-Verlag, 1997.
[2] L. Lamel, S. Bennacef, J.L. Gauvain, H. Dartigues, J.N. Temem, ``User Evaluation of the MASK Kiosk,'' Proc. ICSLP'98, Sydney, Australia, pp. 2875-2878, décembre 1998.

Gpe Traitement du Langage Parlé

Dpt CHM

+ Sommaire

Présentation