_____________________
Objet
La réalisation d'un système informatique capable de dialoguer nécessite de résoudre différents problèmes, parmi lesquels on peut citer : la représentation de la structure des échanges dans un dialogue, la gestion des phénomènes de communication, ou l'évaluation du déroulement d'un dialogue. Afin d'analyser ces phénomènes sur des dialogues réels, nous avons développé un outil d'annotation de corpus de dialogues.
Description
L'analyse de dialogues réels ne peut être réalisée par un système complètement automatisé, du fait du manque d'analyseur syntaxique suffisamment robuste et de la diversité des connaissances à modéliser pour traiter des dialogues portant sur des tâches très diversifiées. De ce fait, nous avons développé une interface permettant d'introduire manuellement les informations utiles à la construction de la structure du dialogue. Cette structure a pour but d'organiser les interventions en échanges, et de hiérarchiser ces derniers en fonction de leurs relations thématiques. Sa construction automatique est fondée sur la connaissance du type des interventions (question polaire, question objet, affirmation...), du type de l'acte de langage (informer, demander...), et soit du type de la relation thématique existant entre la nouvelle intervention et l'une des interventions précédentes (thème subordonné, thème dominant, ou thème identique) ou bien de l'indication de l'introduction d'un nouveau thème. Pour introduire ces informations dans les dialogues étudiés, nous avons défini une balise SGML spécifique, associée à chaque partie des tours de parole constituant une intervention. Chaque champ de cette balise correspond à l'une des informations précitées. L'interface développée permet de prédéfinir des listes de valeurs pour les différents champs et d'en ajouter de nouvelles, de façon à s'adapter à tout type de dialogue. La structure construite donne ensuite lieu à une visualisation graphique : à tout instant au cours de l'annotation, il est possible de visualiser la structure découlant des informations entrées. Cette fonctionnalité permet un contrôle dynamique de la validité du balisage effectué. La construction de la structure se déroule en deux phases : calcul de l'intention communicative associée à chaque intervention et insertion des interventions dans la structure.
Ce type de modélisation, en structurant finement les échanges, permet de déterminer des critères d'évaluation liés à la forme du dialogue (comme le nombre d'échanges portant sur un même sujet et le nombre de questions sans réponses), critères qui sont révélateurs de phénomènes particuliers de communication (par exemple, difficulté à résoudre un problème ou situation d'incompréhension). L'utilisation de cet outil nous permettra d'étudier des dialogues portant sur des tâches différentes (explication, renseignement, enseignement, aussi bien écrits que transcrits de l'oral) et ainsi de définir précisément des critères d'évaluation. Cette analyse nous permettra aussi d'aller plus avant dans l'étape de validation de notre modèle de dialogue, en montrant son adéquation à un grand nombre d'exemples.
Résultats et perspectives
L'intérêt de ce travail est d'enrichir l'annotation de corpus de dialogue en introduisant des informations de type syntaxique, sémantique et pragmatique. Une de nos perspectives est aussi de constituer une base d'exemples en vue de mettre en oeuvre un raisonnement par analogie pour améliorer les stratégies de communication.
Références
[1] B. Grau, A. Vilnat : << Cooperation in Dialogue and Discourse Structure, Workshop Collaboration,
Cooperation and Conflicts in Dialogue Systems >>, IJCAI 97,
Nagoya, Japon, pp. 33-39.
[2] T. Raulin, C. Tremblin : << Application pour l'annotation de corpus >>,
Stage élèves-ingénieurs IIE,
Rapport Interne LIMSI, 1998.
Gpe Langage et Cognition |
| Dpt CHM |
|
Sommaire
|
| Présentation |
|
---|