Evaluation

La recherche en reconnaissance de la parole a grandement bénéficié de l'utilisation du paradigme de l'évaluation, qui, à travers des programmes comme celui du DARPA aux Etats-Unis a fait progresser considérablement l'état de l'art dans ce domaine. Bien que l'utilisation de l'évaluation ait été jusqu'à présent parcellaire dans le domaine de la modélisation linguistique, ceci aussi bien pour l'écrit que pour l'oral, et peut-être plus particulièrement pour la langue française, on assiste actuellement à l'apparition d'une prise de conscience des besoins en la matière, besoins qui se font d'autant plus sentir que les progrès récents de la technologie, des moyens de communication et des normes (par exemple SGML et UNICODE pour le format des données ou EAGLES pour les formalismes) rendent possible des actions qu'il n'aurait pas été raisonnable de considérer il y a quelques années.

Cette prise de conscience se concrétise au plan national par des iniatives comme les programmes communs aux départements SHS et SPI du CNRS, comme l'ancien programme ``Cognition Communication Intelligente et Ingénierie des Langues'' dont l'action GRACE faisait partie et dont l'objectif était l'évaluation sur la tâche de marquage morpho-syntaxique du français (fin au premier semestre 1998) et qui trouve son prolongement toujours sous les mêmes auspices dans le projet MULTITAG du nouveau programme ``Ingéniérie des Langues''. MULTITAG vise à obtenir à partir des données marquées durant la campagne d'évaluation GRACE, un corpus annoté et validé qui sera mis à disposition de la communauté des chercheurs et développeurs tout en réalisant pour la première fois une expérience de combinaison automatique des informations produites par les différents étiqueteurs issus aussi bien de la recherche que de l'industrie et dont les origines regroupent divers pays Européens et incluent même le continent Nord-Américain.

Pour l'oral et en restant sur le plan francophone, cette prise de conscience se retrouve dans l'action de recherche concertée B1 de l' AUPELF-UREF dans laquelle une partie des efforts a porté sur l'évaluation des modèles de langage.

Au plan Européen, l'action préparatoire ELSE (Evaluation in Language and Speech Engineering) dont le LIMSI a la responsabilité scientifique et qui sert de préambule aux activités d'évaluation qui auront lieu dans le 5ème Programme Cadre de la Communauté Européenne est représentative des préoccupations actuelles en matière d'évaluation, ne serait-ce que par son objectif d'aboutir à une proposition d'infrastructure européenne générique pour l'évaluation, construite autour des procédures d'évaluation reposant essentiellement sur une approche quantitative en mode opaque.