Département "Communication Homme-Machine"

___________________________

J. Mariani

Plateforme de Communication Homme-Machine Multimodale

Socio-économie de la communication interactive

Groupe Traitement du Langage Parlé
Groupe Langage et Cognition
Groupe Interaction et Multi-Modalités
Groupe Cognition Humaine

Une Communication au service de l'Homme

L'objectif général des activités du département est de correspondre à un besoin, présent ou futur, de la société dans les rapports utilisateur-machine ou dans la perspective d'une communication médiatisée, suivant le thème de la << Communication au service de l'Homme >>. Il convient de prévoir la manière dont ces rapports vont évoluer en fonction des nouvelles technologies disponibles, en particulier avec la spectaculaire augmentation de l'accès interactif aux informations multimédias en quantité croissante, alors que l'accès intelligent à ces informations fait apparaître de nombreux problèmes scientifiques encore ouverts, et que se posent des enjeux sociétaux et économiques majeurs (accès à l'information pour tous, plurilinguisme, internationalisation et accélération des prises de marché...).

Multimodalité et pluridisciplinarité

Le département << Communication Homme-Machine >> du Limsi regroupe un ensemble de compétences permettant de traiter les différentes modalités de communication, verbales et non-verbales, avec des éclairages différents. Ces activités portent sur le traitement du langage parlé, le traitement du langage écrit, la vision par ordinateur, la synthèse d'image, la reconnaissance de gestes. Ces différents aspects sont traités sous l'angle de la perception (analyse et compréhension de textes, reconnaissance de parole, analyse de scènes visuelles, reconnaissance de caractères, de gestes ergotiques ou sémantiques...) et de la production (génération de textes, synthèse vocale, synthèse d'images, de gestes ou de mouvements...). Les aspects cognitifs (représentation des connaissances, génération de plans, raisonnement, apprentissage...) sont partout sous-jacents. Les activités du département incluent aussi l'intégration de modalités, en entrée comme en sortie, et les relations entre le langage et la représentation du temps et de l'espace, ainsi que l'étude des activités cérébrales dans la verbalisation d'informations spatiales, que nous menons avec des spécialistes de neuro-imagerie. Ces aspects sont abordés avec différents éclairages : ceux des sciences et technologies de l'information (informatique, automatique, traitement du signal, théorie de l'information...), mais aussi ceux de la linguistique, de la psychologie cognitive, de l'ergonomie et, plus récemment, de la socio-économie.

On trouvera donc ici, pour chacun des groupes qui composent le département, << Traitement du Langage Parlé >>(TLP), << Langage et Cognition >> (L&C), << Interaction et Multi-Modalités >> (IMM) et << Cognition Humaine >> (CH), la présentation générale de sa problématique et de ses objectifs, et une illustration de ses activités de recherche à travers les pages de présentation, ainsi qu'une présentation des actions transversales << Plate-forme de communication homme-machine multimodale >>, << Socio-économie de la communication interactive >> et << Corpus et Evaluation >>.

Une plate-forme faite pour coopérer

Une action transversale de mise en place d'une plate-forme de communication homme-machine multimodale, initialisée en 1995 et placée sous la responsabilité de F. Néel, permet de rassembler les différentes compétences qui coexistent dans le département autour d'un petit ensemble sélectionné de projets communs sur des tâches génériques (aide à la navigation automobile, aide au handicap, aide à la conception). Cette action a aussi pour objectif de mettre en place un environnement de développement logiciel soucieux des principes d'interopérabilité et de réutilisatibilité. L'investissement consenti dans cette action porte à présent ses fruits, puisqu'elle nous a permis de lancer un projet européen (Esprit-BRA Magic Lounge), de signer une convention de coopération avec les sociétés PSA et Technibraille et d'initialiser une collaboration avec le SRI. Les activités récentes évoluent vers les systèmes multi-agents, le travail coopératif et l'interaction avec les cartes actives.

Socio-économie de la communication interactive

Depuis 1995 également, le département traite des aspects socio-économiques relatifs aux recherches en matière de communication interactive, grâce à la présence d'un sociologue spécialiste de ces questions, C. Henry. Cette réflexion intervient dans le déroulement même des recherches. Elle se poursuit au sein du laboratoire dans le cadre du projet de Plate-forme de communication multimodale, mais également dans le cadre d'un groupe de réflexion national SPI-SHS << Perspectives en Communication Interactive >>. Ce groupe de réflexion s'est réuni régulièrement pour débattre de questions relatives à des programmes de recherche et développement poursuivis dans différents domaines industriels ou de service (SNCF, Matra-Hachette, IBM, DGAC, municipalité d'Issy-les-Moulineaux, hôpital de Grenoble, ENSCI...), et les premières conclusions ont été présentées à la conférence Ergo-IA en 1998. Un spécialiste des questions de sociologie du traitement de l'information scientifique et technique, et du travail coopératif assisté par ordinateur (groupware), W. Turner, a par ailleurs rejoint le laboratoire en 1998. Une collaboration avec le laboratoire ITEM de l'ENS-Ulm sur la réalisation d'un site hypermédia consacré à Nietzsche a déjà été lancée dans le cadre du programme << Sciences de la Cognition >>.

Une forte demande du secteur aval

Les recherches que nous menons se placent de fait dans plusieurs domaines applicatifs. Celui des transports : ferroviaires, avec les projets Esprit-MASK (Multimodal Multimedia Automated Service Kiosk) et Télématique Railtel, puis Arise, qui nous associent à la SNCF et à d'autres partenaires européens, pour les renseignements sur les horaires de train et les réservations de place, dans le cadre de bornes interactives ou de liaisons téléphoniques ; automobiles, dans le cadre d'une coopération avec PSA au sein d'un projet du GIS Sciences de la Cognition. Dans le secteur de l'aide aux handicapés : en coopération avec l'INJA pour l'aide aux non-voyants, dans le cadre de la reconnaissance de la Langue des Signes Française (LSF) pour l'aide aux muets, et dans le cadre d'un contrat TIDE-Home, pour la commande d'environnement. Les travaux sur l'aide aux non-voyants se sont prolongés en 1998 vers l'accès à la toile électronique pour non-voyants, dans le cadre d'une bourse post-doc cofinancée par le CNRS et la société Technibraille. Nous collaborons également avec les hôpitaux Saint-Antoine et Avicenne sur le sujet des implants cochléaires. Une nouvelle collaboration est envisagée avec l'hôpital Tenon, pour l'analyse physiologique et acoustique des voix pathologiques. Nous avons conduit deux projets sur les applications téléphoniques, avec le CNET et France Telecom, pour la reconnaissance de la langue et du locuteur par téléphone. Nous avons obtenu cette année un contrat de la DGA pour la reconnaissance de la langue (avec 11 langues traitées). Nous souhaitons à présent travailler sur la communication homme-machine, ou homme-homme via la machine, à distance, en bénéficiant de la mise en place des réseaux à haut-débit. Nous avons obtenu un contrat qui nous fait collaborer avec Matra-Nortel et la SNCF sur la reconnaissance vocale distribuée dans le cadre du programme << Réseau National de Recherche en Télécommunications >> (RNRT) (projets Vocadis). Le groupe << Cognition Humaine >> a par ailleurs conclu un contrat avec Bouygues Télécom. D'autres études portent sur les déplacements dans le métro parisien avec la RATP, ou sur la planification de trajets automobiles, dans le cadre d'une collaboration avec l'INRIA. Nos travaux en Réalité Virtuelle et Augmentée trouvent un domaine d'application particulièrement intéressant dans la navigation humaine interactive pour les interventions en milieu hostile, sujet que nous développons en coopération avec la Direction des Etudes et Recherches d'EDF dans le cadre d'une bourse CIFRE. Nos travaux en matière d'utilisation d'agents pour le génie linguistique ont été étendus à la gestion de projet au sein du projet Eureka PVS.

Image et interaction 3D

Nos travaux dans le domaine de l'image doivent nous conduire à collaborer avec l'Université d'Illinois à Urbana-Champaign dans le contexte du programme de collaboration du CNRS avec cette université. Par ailleurs, une activité s'est récemment développée sur l'imagerie médicale, et A. Osorio organise en mars 1999 une journée sur ce thème à Nancy, dans le cadre du Festival du Film de Chercheurs. Nous avons enfin pu réaliser l'investissement prévu de longue date sur l'acquisition d'une machine relativement puissante (système SGI Onyx) pour mettre en place un système d'immersion en réalité virtuelle. Une toute première application de ce nouvel équipement est la visualisation et l'interaction 3D avec des écoulements aérodynamiques, dans le cadre d'une coopération entre le département << Communication Homme-Machine >> et le département << Mécanique-Energétique >>.

Multimodal et multimédia

Nos préoccupations très pionnières sur les problèmes liés au multimodal et au multimédia, que nous avions déjà essayé d'amplifier en termes d'efforts et de cercle de partenaires, trouvent à présent leur écho dans le programme national I3 (Information-Interaction-Intelligence), où nous participons au Comité de Direction, et dans les programmes de la Commission Européenne, puisque nous avons été fondateurs du réseau d'excellence I3Net, au sein du programme ESPRIT Long Term Research << Intelligent Information Interfaces >> (I3). Nous participons au projet << Magic Lounge >>, qui porte sur le thème en pleine émergence de la communication médiatisée et dans lequel nous sommes responsables de la réalisation du démonstrateur. Nous avons obtenu par ailleurs un projet Esprit LTR sur la communication multimodale (Chameleon), et collaborons avec l'IRSIT de Tunis sur la communication multimodale appliquée aux problèmes de coupe. Nous avons enfin participé à plusieurs réunions préparatoires au lancement du 5ème Programme-Cadre de l'Union Européenne, dans les discussions relatives à la mise en place d'un des axes thématiques, intitulé << Information Society Technologies >> . Nous sommes intervenus pour la définition de la stratégie du secteur << Technologies des Langues >> (Human Language Technologies), du programme << Multimedia Content and Tools >> qui le recouvre, et pour le secteur << Future Emerging Technologies >> qui est traité en parallèle. Ces programmes bénéficieront de budgets très conséquents pour les quatre années à venir (de l'ordre de 125 Meuro (800 MF environ) pour le secteur << Technologies des Langues >>, par exemple).

Outre les coopérations inter-groupes conduites au sein de la plate-forme, des collaborations bilatérales ont été également soutenues par des Actions Incitatives internes au laboratoire. On notera, en 1997, un projet entre TLP et IMM sur la perception visuelle, un projet associant spécialistes du geste et de la vision (reconnaissance des gestes par caméra), une action entre CH et TLP sur la perception de la hauteur tonale, qui a conduit à une publication commune dans le JASA, et une action visant à utiliser les graphes de Sowa, venus du Traitement du Langage Naturel, pour la représentation des icônes. En 1998, un projet a été retenu qui allie les groupes TLP et L&C sur l'extraction d'informations à partir d'un corpus vocal. Ce projet doit nous permettre de participer aux évaluations du Darpa sur la recherche d'informations vocales (Spoken Data Retrieval (SDR)) ou la détection et le suivi de thèmes de discussion (Topic Detection and Tracking (TDT)). Nos travaux en transcription et en indexation de documents multimédias nous ont permis d'obtenir un contrat de la Commission Européenne (Telematics Olive) et un contrat de la DGA. Les travaux sur l'animation de créatures articulées au sein du groupe IMM pourraient bénéficier du savoir-faire en matière de communication langagière présent dans les autres groupes du département, dans la perspective de la production d'avatars ou d'agents intelligents.

Nous regroupons donc un très fort potentiel pluridisciplinaire en matière de communication homme-machine, qui se situe à un excellent niveau international, en jouant un rôle de précurseur. Nous avons cependant des manques qui nécessitent une action très volontariste pour y remédier. En particulier, il serait nécessaire de recruter un cadre pour les activités en image (vision par ordinateur ou synthèse), ce que nous n'avons toujours pas pu réaliser sur un poste de professeur ou de directeur de recherche.

L'évaluation pour mesurer la qualité des recherches

Si nous accordons une forte priorité aux activités relatives à la communication multimodale et au traitement des documents multimédias, nous plaçons également l'accent sur l'utilisation du paradigme d'évaluation pour accompagner les recherches, et sur l'utilisation de ressources linguistiques, corpus, lexiques, pour développer les systèmes et les évaluer.

Nous avons participé, en 1996, 1997 et 1998, à la campagne de test du DARPA aux Etats-Unis, sur la tâche << Broadcast News >> qui consiste à transcrire des émissions de radio et de télévision. Cette tâche contient un grand nombre des problèmes difficiles à traiter et spécifiques au traitement de la langue parlée : parole spontanée (hésitations, tournures agrammaticales, phrases inachevées...), bruit de fond (musique, bruits d'ambiance, réverbération, effet de cocktail party, effet Lombard...), problèmes de prise de son (appels téléphoniques, microphone placé à distance...). De plus, il convient de traiter l'anglais américain, avec un lexique qui dépasse 65 000 mots. Malgré ces conditions difficiles, nous nous sommes placés au premier rang en 1996, au second en 1997 et à nouveau au premier rang pour l'une des deux conditions de test en 1998, dans cette très forte compétition internationale. Nous avons par ailleurs obtenu les meilleurs résultats pour la tâche << Named Entities >>, où il convient d'extraire dans le message transcrit les informations relatives aux noms propres (noms de personne, de lieux, dates, etc). Nous avons également participé aux campagnes de test organisées dans le cadre des Actions de Recherche Coordonnées (ARC) de l'AUF (ex Aupelf-Uref), et avons obtenu les meilleurs résultats dans toutes les conditions de test pour la reconnaissance vocale de grands vocabulaires comme pour la conversion graphème-phonème en synthèse vocale, pour la langue française. Enfin, les campagnes d'évaluation de notre système développé dans le projet Mask, visant à la réalisation d'une borne d'informations multimodale et multimedia pour la réservation et l'achat des billets de train, et sa comparaison avec le système tactile actuel, ont démontré son acceptabilité par les utilisateurs de la SNCF.

Nous tentons de promouvoir l'utilisation du paradigme d'évaluation dans le cadre de programmes nationaux et internationaux. Nous avons été ainsi à l'initiative de l'action Grace, sur l'évaluation des analyseurs morpho-syntaxiques du français, qui a été soutenue par le CNRS dans le cadre du programme CCIIL (Cognition, Communication Intelligente et Ingénierie des Langues), et dont la campagne de test s'est terminée en mars 1998. Nous avons également proposé que cette approche serve de cadre pour les Actions de Recherche Coordonnées de l'agence francophone AUF. Sept actions ont ainsi été menées sur différents aspects du traitement du langage écrit ou parlé (Extraction de documents textuels, alignement de textes bilingues, extraction automatique de termes, compréhension de textes, dictée vocale, dialogue oral et synthèse de parole). Un premier bilan, très positif, a été établi lors des Journées Scientifiques et Techniques que nous avons organisées en Avignon, en Avril 1997. La deuxième campagne débute à présent. Dans le cadre du Comité Consultatif Interministériel pour le Traitement Informatique des Langues (CCTIL), nous avons proposé cette approche comme axe principal d'un programme coordonné français portant sur les aspects de recherche fondamentale, de recherche technologique et de développement applicatif dans le domaine de l'Ingénierie de la Langue, mais les réponses des pouvoirs publics sont très en retrait par rapport aux enjeux pourtant majeurs de ce secteur. La plus marquante est celle de la DGLF qui a lancé un programme sur la production d'un << Corpus du Français Contemporain >>, doté d'un comité de pilotage auquel nous participons. Nous avons trouvé un écho encore plus positif auprès de la Commission Européenne, puisque nous avons proposé deux projets fondés sur cette approche qui ont été retenus : DISC, concernant les << Bonnes Pratiques >> en matière de systèmes de dialogue oral, et ELSE, que nous coordonnons scientifiquement et qui a pour but de proposer une infrastructure d'évaluation en matière d'ingénierie des langues pour le 5ème Programme-Cadre.

Les ressources pour développer et évaluer les systèmes

En parallèle, nous participons à plusieurs actions relatives à la production et à la diffusion de ressources. Nous sommes ainsi à l'initiative de l'Association Européenne pour les Ressources Langagières (ELRA), soutenue par la Commission Européenne, et avons participé aux projets Speechdat, sur les corpus vocaux téléphoniques, et Babel, qui étend cette action aux pays de l'Europe Centrale et Orientale. Les corpus BREF-80 et BREF-Polyglot, réalisés au Limsi, apparaissent parmi les ressources les plus demandées à l'ELRA, et nous distribuons à présent le corpus BREF complet par le même canal. Le lexique que nous avons réalisé pour notre système de reconnaissance en langue anglaise évalué dans le programme du DARPA fait également l'objet d'un grand intérêt auprès des laboratoires de recherche publics ou privés. Nous faisons partie des membres fondateurs du projet Silfide, soutenu par le CNRS et l'Aupelf-Uref. Dans cette même direction, nous avons soutenu l'idée d'un programme CNRS << Ingénierie des Langues >> visant à produire et à diffuser des ressources linguistiques, et participons à son comité de pilotage. Deux actions que nous avions proposées y ont été retenues : Multitag, qui, fondé sur les travaux de Grace, a pour but de mettre à disposition de la communauté scientifique un très important corpus de textes (1 Million de mots) enrichis d'étiquettes morpho-syntaxiques, et une deuxième action qui a également pour objectif de mettre à disposition de la communauté scientifique un lexique et un corpus contenant les représentations graphémiques et leurs équivalents phonémiques tenant compte des variantes régionales et socio-linguistiques. Ces actions devraient permettre à la langue franç aise de combler en partie le retard qu'elle présente par rapport à l'anglais, langue pour laquelle il existe déjà de nombreuses ressources, pour l'écrit comme pour l'oral, à forte valeur ajoutée. Le réseau Francophone de l'Ingénierie de la Langue, FRANCIL, que nous coordonnons pour l'AUF depuis 1994, correspond à ce même objectif. Outre l'action ``Corpus du Français Contemporain`` de la DGLF, une action ``Corpus Clef du Français Actuel``, proche du British National Corpus, a été lancée par le Ministère fran çais de la recherche, et nous sommes également dans son Comité de Pilotage.

Chercher les synergies

L'intérêt que nous portons aux ressources linguistiques et à l'évaluation, ainsi que l'arrivée au laboratoire de spécialistes de ces questions (P. Paroubek, C. Jacquemin, B. Habert) nous a conduits à mettre en place un groupe de travail transversal << Corpus et évaluation >> (Corval), placé sous la responsabilité de P. Paroubek, qui vient s'ajouter aux activités communes qui cimentent l'unité du département, voire celle du laboratoire, autour de la plate-forme de communication multimodale ou dans des projets bilatéraux, comme l'indexation et la recherche de documents multimédia, la vélocimétrie par image de particules à l'aide d'une technique de flot optique ou l'étude des écoulements aérodynamiques à l'aide d'un système de réalité virtuelle. Nous notons en effet que c'est grâce à la rencontre de disciplines différentes, pour lesquelles nous occupons une place d'excellence, que nous pouvons accomplir un saut scientifique ou technologique dans la démarche visant à apporter une solution à un problème de recherche.

+ Sommaire

Dpt Mécanique

Présentation

visiteurs.