MODÉLISATION CONNEXIONNISTE DE LA COMPRÉHENSION

DE TEXTES

_____________________

A. GUHA et J.-P. ROSSI

Figure

Objet

L'objet de cette recherche est de déterminer les conditions de conception d'un modèle expérimentable de la compréhension de textes, en s'appuyant sur une tentative d'implémentation du modèle de "construction-intégration" proposé par Walter Kintsch en 1988. Ce modèle semble adapté à des textes narratifs courts. L'objectif est de prolonger le modèle, d'une part en précisant la nature des unités sémantiques représentant un texte (condition nécessaire à l'automatisation du processus), d'autre part en élaborant des hiérarchisations d'informations plus complexes que celle proposée par Kintsch, de façon à étendre la validité du modèle à des textes argumentatifs.

Contenu

Dans le modèle de Kintsch, ce sont des réseaux d'unités sémantiques (propositions) qui représentent la base de connaissances, le texte, ainsi que sa macrostructure (c'est-à-dire les informations importantes, qui pourraient servir de résumé). Le texte est découpé en segments correspondant à plusieurs propositions. Chaque segment donne lieu à la construction d'un réseau joint à celui qui représente la macrostructure. L'intégration consiste en la sélection dans ce nouveau réseau de certaines propositions, par propagation d'activation. Les propositions sélectionnées constituent la macrostructure à l'étape suivante. Puis le processus est répété pour le segment suivant, jusqu'à examen du texte entier. Une matrice de connexité détermine les modalités de la propagation.

Nous avons élaboré un "langage" de propositions fondé sur un typage rigoureux (inspiré de la logique des prédicats, mais ne recourant pas à sa sémantique). Le recours à des critères syntaxiques a permis la définition de règles univoques de réécriture du texte sous forme de propositions. Cette étape a permis de souligner l'une des difficultés du modèle de Kintsch : un système de représentation du texte plus éloigné de la syntaxe donne lieu à un plus grand arbitraire dans la transposition (par l'expérimentateur) d'un texte à ce système.

Nous avons développé une application informatique implémentant le modèle initial, ce qui nous a permis de l'expérimenter en "grandeur nature" sur un texte de 533 propositions, puis d'analyser les conséquences de la modification de paramètres sur le processus d'intégration. L'implémentation permet d'explorer empiriquement des questions sur lesquelles la théorie reste muette, en particulier les conditions de convergence du processus et le profil topologique de la répartition finale de l'activation. L'analyse topologique de la propagation d'activation pour différentes valeurs des paramètres (activation initiale, matrice de connexité) a permis de cerner la puissance et les limites des moyens du modèle initial.

Situation

Malgré les simplifications de l'expérience (la base de connaissances générales n'est pas utilisée dans les simulations), certains ressorts essentiels du modèle ont été mis en évidence. En particulier, il s'avère que le résultat de la propagation d'activation dépend surtout des propriétés de la matrice de connexité, et quasiment pas de la répartition initiale de l'activation. Par ailleurs, la sélection de propositions réalisée par le processus d'intégration consiste en fait en la sélection d'une seule d'entre elles et de ses voisines les plus proches. Les expériences menées sur différentes matrices de connexité ont montré qu'il est impossible d'obtenir une hiérarchisation moins triviale des propositions sans prise en compte de leur valeur sémantique. Un modèle utilisant efficacement la propagation d'activation semble devoir comporter "plus de sémantique" dans la constitution de sa matrice de connexité.

Références

(1) Guha, A. : "Compréhension de textes : Une analyse du modèle de Kintsch". Mémoire du DEA de Sciences Cognitives, Université de Paris-Sud, Orsay, 1995.

Gpe Cognition Humaine

DptCHM

+ Sommaire

Présentation