_____________________
Objet
Ce travail porte sur un processus d'analyse thématique de textes narratifs s'attachant à l'identification au sein de ces textes des situations du monde réel qu'ils évoquent. Nous abordons ce problème en utilisant une mémoire épisodique supportant un apprentissage incrémental pour détecter les changements thématiques.
Description
La compréhension de textes nécessite l'utilisation de connaissances pragmatiques pour être en mesure d'expliciter les liens de cohérence entre phrases. Dans un contexte où l'on ne suppose pas l'existence d'une base complète de telles connaissances, l'analyse de textes devient un processus complexe de compréhension et d'apprentissage dont les connaissances vont s'améliorer au fil des analyses. Nous appliquons ce principe à l'analyse thématique en fondant celle-ci sur une mémoire épisodique chargée de recueillir les représentations de texte construites par le système de compréhension et de les organiser suivant un principe directeur majeur : tous les éléments jugés similaires sont stockés au sein d'une même structure. On assure ainsi la mise en oeuvre d'un processus d'accumulation et on fait intervenir une généralisation implicite par le renforcement des traits récurrents des situations. Chacun des éléments de la mémoire se voit donc assigner un poids. Celui-ci quantifie le degré de récurrence de cet élément relativement à la structure dont il fait partie. La mémoire épisodique, associée au réseau sémantique que constitue le treillis de types des graphes conceptuels, forment donc un réseau dont les connexions sont pondérées. Ce réseau est combiné à un mécanisme de propagation d'activation qui confère à la mémoire épisodique des propriétés de mémoire associative. L'analyse d'un texte, opérée à partir des graphes conceptuels représentant ses propositions, consiste à construire les représentations des situations évoquées par le texte, appelées ici Unités Thématiques (UT), et à établir les relations existant entre elles : déviation vers un thème proche ou changement plus radical de thème. Ce processus s'appuie pour cela sur les propriétés d'associativité de la mémoire épisodique. Lorsqu'il considère chacune des propositions d'un texte, il doit déterminer si elle se rattache à l'une des UTs déjà en cours de construction ou si elle introduit une nouvelle UT, i.e. s'il y a ou non introduction d'un nouveau thème. La mémoire épisodique offre le moyen de caractériser la proposition en cours et les UTs en construction par un contexte de même nature (cf figure 2) : il leur est associé un ensemble d'UTs agrégées issues de la mémoire suivant des modalités spécifiques à chaque entité mais reposant dans les deux cas sur la propagation d'activation évoquée ci-dessus. Ce contexte représente les situations connues jugées les plus pertinentes pour intervenir dans le traitement de l'entité en question. Cette caractérisation homogène fournit les moyens d'évaluer la compatibilité d'une proposition et d'une UT en construction par le calcul d'une mesure de similarité entre leurs contextes respectifs. On peut ainsi déterminer à quelle UT la proposition courante doit être rattachée : en fonction de la valeur de cette mesure pour les différentes UTs en construction, on décidera en effet d'associer la proposition à l'une d'entre elles ou au contraire d'introduire une nouvelle UT.
Résultats et perspectives
Ce processus a été implanté en Smalltalk. Nous avons constitué manuellement un premier ensemble de représentations de texte afin de construire une mémoire épisodique et nous avons ajusté les paramètres de l'algorithme en l'appliquant aux textes ayant servi à bâtir cette mémoire. Il reste donc à étendre ces résultats préliminaires à des textes inédits en s'interrogeant sur une méthode d'évaluation adéquate.
Références
[1] Ferret O. and Grau B. : <<An Aggregation Procedure for Building Episodic Memory>>. IJCAI-97, 1997.
[2] Ferret O. et Grau B. : <<Une Analyse Thématique s'Appuyant sur une Mémoire Épisodique>>.1ères JST FRANCIL, 1997.
Gpe Langage et Cognition | Dpt CHM |
Sommaire
|
Présentation |