_____________________
Objet
Ce travail fait partie du projet MoHA, fondé sur l'apprentissage du sens par accumulation d'expériences perceptuelles. Dans ce cadre, le but de cette étude est d'expliciter comment construire automatiquement un réseau sémantique à partir d'une suite de dialogues écrits découpés en situation. Ce réseau devra conserver des liens avec les expériences qui ont servi à le créer. L'élaboration de la solution proposée à ce problème à été guidée par des indices neurophysiologiques, psycholinguistiques et psychologiques.
Contenu
La construction se fait en plusieurs étapes, regroupées en deux phases qui se répètent alternativement, et le réseau construit est un réseau à deux niveaux.
Dans la première phase, dite d'acquisition, on modélise comment les informations des données de bases s'accumulent. La donnée est une série de dialogues. Chaque dialogue est découpé au préalable en situations, unités d'action, de temps et d'espace. Dans chaque situation un poids est attribué à chaque mot. Ce poids correspond à l'importance du mot dans cette situation. Une donnée élémentaire fournie au système peut donc se représenter comme l'exemple de la figure 1, nous l'appellerons une situation. Cela modélise la façade langagière de l'expérience. Le premier niveau du réseau, dit niveau de l'expérience, qui résulte de l'accumulation des situations précédentes, présente, juste avant l'intégration de la nouvelle situation, un aspect semblable à l'exemple de la figure 2. C'est un réseau où alternent des noeud-situations et des noeuds-mots qui possèdent un niveau d'activité correspondant à leur prégnance au moment où arrive la nouvelle situation. Ces noeuds sont reliés par des liens munis de poids qui correspondent à la plus ou moins grande facilité à transmettre l'activité.
Avant d'être intégrée au réseau, la situation subit un filtrage : seul une partie des mots de cette situation seront mémorisés dans le réseau. Cela correspond à la notion de mémoire de travail à capacité limitée développée par des psychologues. Pour sélectionner ces mots on utilise les poids sur les arcs et divers critères. Citons comme exemple de critère la familiarité qui va augmenter les poids des mots déjà présents dans le réseau (fig. 3). Après application des critères, seuls les mots correspondant aux poids les plus forts seront conservés.
Ensuite la nouvelle situation est ajoutée au réseau et on provoque une propagation d'activité depuis le nouveau noeud-situation (fig. 4). Cela modifie le niveau d'activité de plusieurs noeuds dans le réseau. En conséquence les poids entre ces noeuds sont recalculés suivant une règle de Hebb.
Dans la deuxième phase, dite de structuration, le deuxième niveau du réseau, le niveau conceptuel, se construit à partir du niveau de l'expérience. Cette phase intervient après l'intégration de plusieurs situations de suite. En propageant l'activité depuis des paires (noeud-mot, noeud-situation), ce qui correspond à la perception de mots en contexte, on isole des nuages de noeud-situations et de noeud-mots qui correspondent aux différents sens d'un mot. Les noeuds d'un même nuage sont alors tous reliés, par des liens valués, à un nouveau type de noeud : un noeud-conceptuel qui appartient au deuxième niveau. Ce noeud-conceptuel est alors relié par d'autres liens valués à d'autres noeud-conceptuels du deuxième niveau (fig. 5).
Situation
Une grande partie de la validité du modèle étant subordonnée à la loi de propagation d'activité, nous étudions actuellement ses capacités de désambiguation en contexte du sens d'un mot sur une partie du réseau de premier niveau. Étant donnée une partie de réseau formée d'un noeud-mot correspondant à deux sens différents (par exemple "table"), on étudie les ensembles de noeuds "suffisament" activés obtenus par propagation depuis des paires (noeud-mot, noeud-situation) (fig. 6). Pour cette étude on a réalisé un logiciel.
Références
(1) Gruselle J-P : "From Experience to Abstract Meaning". Proceedings of NEw Methods in LAnguage Processing, Manchester, September 1994
Gpe Langage et Cognition |
| DptCHM |
|
Sommaire
|
| Présentation |
|
---|