Architecture d'interaction en langue naturelle avec les applications

Architecture d'interaction en langue naturelle avec les applications

_____________________

G. Pitel, J.-P. Sansonnet

 

Figure

Objet

La maîtrise de l'interaction en langue naturelle entre un utilisateur et une application non critique a pour but de permettre l'utilisation d'un logiciel complexe à une personne non initiée. Notre objectif est de proposer un modèle de description générique permettant de produire une interface en langue naturelle avec n'importe quelle application, et mesurer son potentiel en vérifiant les <<dimensions>> de la langue que ce modèle permettra d'exprimer.

 

Description

Nous adoptons une approche par médiateur (Fig. 2), qui permet de créer un pont entre l'utilisateur qui n'a pas de représentation du mécanisme interne de l'application, et l'application qui a été conçue dans une optique fonctionnelle et sans pouvoir prendre en compte la vision de l'utilisateur.

Le médiateur joue donc le rôle de l'interlocuteur de l'utilisateur. Pour cette raison, il doit posséder une description cognitivement adéquate de l'apparence de l'application (son phénomène) à laquelle il sert d'interface. De plus, le médiateur doit savoir commander et interroger cette application. Le médiateur connaît donc à la fois la description de l'application du point de vue de l'utilisateur et du point de vue << informatique >>.

Le fonctionnement du médiateur repose sur des entités nommées observateurs, et sur le graphe formé par ces entités. Conceptuellement, un observateur exprime un point de vue sur ce qu'il << voit >>. Son champ d'observation est principalement tourné autour du langage, mais il inclut aussi toute les perceptions auxquelles il a accès. Un observateur va donc << voir >> certains mots (généralisés à concepts), et écrire une interprétation de cette perception à partir de ses connaissances propres. Une population d'observateurs (Fig. 3), en réécrivant itérativement la phrase donnée par l'utilisateur va produire un concept unifié et exécutable. Comme on ne peut pas raisonnablement exécuter l'ensemble des observateurs de la population pour obtenir cette interprétation, nous introduisons des mécanismes simplifiant le traitement, inspirés de la famille << Expectation Driven Parsing >>, et plus directement du << Word Expert Parsing >> [1].

Les observateurs sont composés de quatre éléments : une règle d'activation R, un sens d'activation S, un processus de réécriture P, un type conceptuel T. Ainsi ils vont dans le sens du principe de << procedural semantics >> de [2] selon lequel le sens d'un symbole réside dans une procédure abstraite.

 

Résultats et perspectives

L'implémentation de ce modèle, en cours, nous permettra de valider son potentiel, de l'améliorer, ou de le rejetter le cas échéant. Cependant, d'après plusieurs expériences manuelles préliminaires, il est capable de résoudre quelques cas intéressants de manière très générique et sans demander trop de travail (dans une application-jouet de déplacement d'objets dans une grille, Fig. 1). La similarité avec les réseaux de contraintes fait de plus de ce modèle un excellent candidat à l'optimisation.

Références

[1] S. L. Small : << Word Expert Parsing : a Theory of Distributed Word-Based Natural Language Understanding >>, Phd Thesis, University of Maryland, 1980.
[2] T. Winograd : << A Procedural Model of Language Understanding >>, In Natural Language Processing, Ed. Grosz & Sparck Jones & Webber, 1986.

Groupe AMI

Dpt CHM

+ Sommaire

Présentation

visiteurs.