UNE APPROCHE PAR MARQUAGE TEXTUEL POUR LE TRAITEMENT

DES MÉTAPHORES

_____________________

S. FERRARI

Figure

Objet

La métaphore est une figure de style reflétant un processus cognitif courant. Une étude sur corpus des régularités liées à son énonciations a permis de mettre en évidence l'existence d'un marquage textuel. Nous proposons ici une méthodologie de traitement des métaphores fondée en partie sur ce marquage.

Contenu

Une première étude des régularités liées à l'énonciation des métaphores a permis de mettre en évidence l'existence de marqueurs textuels récurrents. Cette étude a été réalisée sur un corpus de 26 textes explicatifs d'environ 300 mots chacun, recueillis dans le cadre d'une action incitative entre les groupes "Langage et Cognition" et "Cognition Humaine" du LIMSI sur les analogies et métaphores explicatives dans l'enseignement. Les régularités trouvées sont plus particulièrement caractérisés par des structures syntaxiques ainsi que par la présence d'un marqueur lexical.

Les approches actuelles en traitement automatique de la langue ne proposent pas de méthode satisfaisante de détection des métaphores. Les unes se fondent sur une malformation des représentations du sens issues d'un traitement sémantique général, les autres reposent sur une représentation exhaustive des connaissances liées à cette figure. Nous proposons d'exploiter l'existence de régularités de manière à guider le choix du type de traitement sémantique à apporter à une phrase donnée. La méthode tient compte du fait que les marqueurs textuels ne constituent pas une certitude quant à la présence d'une métaphore. Elle se fonde en outre sur l'hypothèse selon laquelle les termes fréquemment employés dans un domaine ne sont pas sources de métaphores nouvelles dans ce même domaine.

Situation

Nous supposons acquis la détection des marqueurs lexicaux et le comptage des fréquences d'occurrences des mots sur un corpus thématique. Nous proposons le déclenchement d'un traitement sémantique de la manière suivante:

-termes fréquents : traitement générique du type préconisé par James Martin, incluant un traitement des métaphores conventionnelles.

-termes en présence d'un marqueur et termes peu fréquents : traitement spécifique de résolution des métaphores fondé d'une part sur une résolution des analogies, d'autre part sur une recherche de propriétés prototypiques

L'inconvénient majeur de la méthode est d'ignorer l'utilisation possible de termes fréquents de manière métaphorique, non conventionnelle, en l'absence d'un marquage textuel. Il paraît raisonnable, dans une optique de communicabilité, de considérer que les termes fréquemment employés ne le soient pas de manière absconse.

Les marqueurs textuels liés à la métaphore font l'objet d'une évaluation sur un corpus électronique de grande taille, par utilisation de l'outil STK, présenté dans la double page précédente. Cette évaluation permet de définir la fréquence d'utilisation dans un cadre métaphorique de chaque marqueur. Nous proposons d'exploiter ce résultat pour la désambiguïsation des multiples représentations de sens issues de la précédente méthode : le type de traitement et la pertinence du marqueur servent à établir la saillance de chaque représentation hors contexte.

Les différents résultats de ces travaux sont l'objet de soumissions à l'ACLA et à SIGIR'96.

Références

(1) Ferrari S. : "Traitement automatique des métaphores : une approche par marquage textuel". Actes du Deuxième Colloque Jeunes Chercheurs en Sciences Cognitives, Presqu'ile de Giens, 1996 -à paraître.

(2) Ferrari S. : "A corpus-based approach for metaphor processing".Proceedins of the AISB96 LEDAR Workshop, Sussex, England, 1996 -à paraître.

Gpe Langage et Cognition

DptCHM

+ Sommaire

Présentation