GROUPE PERCEPTION SITUÉE

PERCEPTION SITUÉE

Exemples d'activités de recherche du groupe

INTRODUCTION

Le groupe Perception Située a pour vocation de contribuer à la compréhension des mécanismes naturels de perception et au développement de systèmes artificiels qui s'en inspirent.

Ses thématiques se placent dans la perspective de la perception active, c'est-à-dire dans l'idée que les systèmes de perception naturels n'opèrent pas une reconstruction interne élaborée de la scène perçue mais sont étroitement liés à l'action dans une boucle perception-action. Leur fonctionnement est ainsi dépendant des comportements du système complet qui les héberge, leur rôle essentiel étant d'extraire de l'environnement les éléments d'information utiles à l'action immédiate.

Dans ce contexte, la notion d'objet doit être reconsidérée. Un objet n'est pas une donnée a priori que le système s'efforcerait de « reconnaître » mais une construction acquise au travers d'un vécu comportemental. L'interaction du système avec son environnement et le contexte qui caractérise ce dernier sont essentiels pour faire l'expérience des invariants à l'origine de l'émergence de la notion d'objet. La connaissance de la variabilité du contexte est essentielle pour y percevoir des catégories. La perception est ainsi à la fois écologique et multi-catégorielle.

Dans le domaine visuel par exemple, l'attention et les mécanismes d'orientation du regard et d'exploration de scènes permettront de sélectionner les éléments pertinents pour l'action en cours et pour saisir l'organisation spatiale des éléments saillants sur laquelle repose la construction de la structure perceptive de l'environnement. Dans le domaine auditif, le paradigme d'Analyse par la Synthèse est au centre de notre approche : la synthèse valide l'analyse, à travers une comparaison qui implique la perception.

Un système de perception sera donc, dans cette optique, toujours considéré en relation avec l'action :

Dans le domaine auditif, les mécanismes d'analyse et de reconnaissance seront étudiés dans leur relation avec la production et la synthèse.

Dans le domaine visuel, les systèmes artificiels élaborés seront toujours imaginés en relation avec l'action et hébergés par un agent disposant de capacités comportementales.

Le groupe Perception Située est organisé autour de trois thèmes :

Analyse et synthèse audio qui a pour objet d'étudier les mécanismes de la production naturelle ou simulée du signal sonore (son musical ou parole) et son analyse naturelle ou artificielle
Systèmes perceptifs et analyse visuelle centré sur une analyse plus globale de la nature de la perception (en particulier associée à l'émergence de la notion d'objet) et sur le développement de systèmes de vision exploratoire et intentionnelle.
Imagerie médicale dont l'objectif est le développement de systèmes interactifs d'aide à l'interprétation d'images médicales et de systèmes perceptifs d'exploration visant à doter un système artificiel d'une connaissance structurée des images analysées.

Les bases de l'approche présentée ici font l'objet d'enseignements universitaires, dans les DEA Sciences Cognitives et Système Electroniques de Traitement de l'Information de l'Université Paris XI, ainsi que dans le magistère de Biologie et le cours inter-magistères de Sciences Cognitives de l'ENS Ulm et à l'ENSTA.

Des collaborations de recherche existent avec notamment avec le Laboratoire de Recherche en Informatique (LRI Paris XI), le Laboratoire d'Acoustique Musicale (CNRS, Paris VI, Ministère de la Culture), le Centre d'Etude des Systèmes Complexes et de la Cognition (CENECC ENS Paris), l'Université « La Sapienza » de Rome, France Telecom Recherche et Développement.

Au travers du thème Imagerie médicale, le groupe Perception Située collabore également avec le Centre d'Imagerie Médicale de la Fédération Mutualiste Parisienne. Depuis 1999 une collaboration au niveau national a été mise en place avec les Centres d'Imagerie Médicale de l'Hôpital du Val de Grâce, de l'Institut Curie, et trois Centres Hospitaliers de l'Université de Paris XI (Hôpital Paul Brousse, Hôpital Antoine Béclère, Centre Chirurgical Marie de Lannelongue).

LES THEMES DE RECHERCHE

THÈME 1 : ANALYSE ET SYNTHÈSE AUDIO

C. d'Alessandro, J.S. Liénard, B. Doval, Vu Ngoc Tuan, N. Henrich, R. Prudon, T. Ehrette, P. Boula de Mareüil, I.Vasilescu, F. Forchino

Le thème 1 s'intéresse à l'analyse et la synthèse dans le domaine vocal et musical, analyse et synthèse étant pensées en rapport avec la perception. Dans le domaine sonore, (comme probablement pour les autres modalités sensorielles) l'analyse, la synthèse et la perception sont en effet intimement liées, en particulier à travers des procédure d'analyse par la synthèse, par l'évaluation perceptive de la synthèse, et par la confrontation entre analyse du signal par une machine et perception humaine.

Un premier volet de recherche est la synthèse de la parole à partir du texte. C'est un thème ancien au laboratoire, qui a développé ou mis en oeuvre quasiment toutes les techniques de synthèse appliquées au Français depuis une trentaine d'années. Nous avons d'ailleurs édité cette année un ouvrage sur la synthèse de la parole, qui contient un disque compact regroupant des exemples sonores de pratiquement tous les systèmes de synthèse à partir du texte développés pour la langue française depuis 33 ans. Le développement actuel, qui fait l'objet de la thèse de Romain Prudon est un système de synthèse à partir de gros corpus de parole étiquetés. L'étiquetage porte sur les aspects phonétiques et phonologique, morpho-syntaxiques, phonotactiques. Il est réalisé de façon automatique, grâce en particulier aux puissants outils d'alignement phonétique et de reconnaissance de la parole du LIMSI. La qualité sonore de ce type de synthétiseur est excellente, parfois proche de la voix naturelle, mais la voix est peu paramétrable, car c'est finalement le corpus qui décide des caractéristiques de la synthèse (voir la page de présentation sur la synthèse). Dans le cadre de la synthèse, nous sommes en train de finaliser la distribution d'un lexique orthographique phonétique du Français de grande taille (340000 formes) en collaboration avec l'ENST, l'Institut de phonétique de Paris III et l'ICP, Grenoble. Les recherches sur la synthèse de parole sont renforcées par le recrutement en 2001 d'un nouveau chercheur CNRS, Philippe Boula de Mareüil.

Le second volet de recherche est l'analyse de la qualité perçue et la mesure des paramètres acoustiques de la voix. L'étude de la source en voix chantée et parlée a abouti à la thèse de Nathalie Henrich, en collaboration avec le Laboratoire d'Acoustique Musicale, qui a été soutenue en novembre 2001. Une synthèse de la source d'excellente qualité permet maintenant d'étudier les paramètres d'analyse par le paradigme d'analyse par la synthèse : on évalue les paramètres d'analyse par ajustement de la synthèse et contrôle perceptif. Les effets perceptifs des paramètres de source peuvent ainsi être également évalués. Cette thèse a apporté de nombreux résultats nouveaux sur les paramètres de la source glottique, en particulier le quotient ouvert. Pour l'analyse de la source également, l'analyse par ondelettes des fermetures glottique a fait l'objet d'une évaluation systématique.

La perception de la qualité vocale fait l'objet de la thèse de Thibaut Ehrette, depuis l'automne 2000, en collaboration avec France Télécom Recherche Développement (Lannion). Le sujet est l'évaluation de la qualité de voix et la mesure des paramètres acoustique pour les application aux services vocaux des télécommunications. Le but est d'établir et de mettre en relation les espaces perceptifs et les espaces acoustiques des voix utilisées dans les services vocaux. Un paradigme d'analyse sensorielle est développé dans ce cadre. L'activité sur la perception de parole a été renforcée grâce au recrutement en 2001 d'une nouvelle chercheuse CNRS, Ioana Vasilescu.

La dualité entre variabilité et invariants est également étudiée au niveau de l'analyse spectrale. Nous avons mis en évidence, sur une base de données de voyelles françaises, des indices spectraux permettant de caractériser les voyelles indépendamment du locuteur et de la force de voix (obtenus par l'étude de la courbure du spectre fortement lissé, tenant compte de phénomènes de masquage auditif). Les informations concernant le locuteur et la force de voix apparaissent dans d'autres aspects spectraux dérivés des mêmes traitements.

La thèse de Nathalie Henrich a été soutenue à l'automne 2001, faisant ainsi un bilan de l'analyse des paramètres de la source glottique en voix chantée. Ces travaux seront aussi l'occasion de diffuser une base de données importante sur la voix chantée et la voix parlée, avec signaux acoustiques et électroglottographiques. Les activités de recherche de l'année 2002 sont bien sûr dans la continuité des recherches actuelles. La modélisation spectrale et la modélisation temps-fréquence de la source vocale, et ses applications à l'analyse, la synthèse et la modification du signal de parole vont se poursuivre. En particulier, les travaux conjoints sur l'analyse et la synthèse donneront lieu au développement d'un système temps-réel de modification des paramètres glottiques dans le domaine spectral. L'étude paramétrique de l'effort vocal sera ainsi développée dans ce cadre d'analyse et de synthèse. La synthèse à partir du texte par gros corpus va se poursuivre, et des débouchés industriels pour ce système vont commencer à être recherchés.

L'étude de la perception de la qualité vocale va également se poursuivre, avec en particulier la définition de protocoles d'écoute et de grilles d'analyse sensorielle paramétrique. Un contrat de recherche avec France Télécom Recherche et Développement sur ce sujet est en cours de discussion. Le thème de la variabilité de la parole va continuer de donner lieu à diverses études, en vue d'en déterminer les causes et les lois. En particulier nous participons à un contrat accordé par l'ACI Cognitique (avec René Carré, ENST et l'équipe de Jean-Marie Hombert, Laboratoire Dynamique du Langage, Lyon 2), concernant la variabilité dans la production et la perception des voyelles. Une base de données phonétiques en cours d'élaboration prendra en compte divers facteurs tels que le locuteur (une centaine), la langue (italien, arabe et 3 dialectes du français), la force de voix, en vue de déterminer les stratégies individuelles des locuteurs et des auditeurs.

THÈME 2 : MODÈLES DE VISION ET ANALYSE PERCEPTIVE

J.-S. Liénard, C. Coussinet, N. Denquive, J. Machrouh, P. Tarroux

L'activité du thème a porté en 2001 sur le développement d'outils destinés à la construction d'agents perceptifs dotés de capacités de vision exploratoire. Trois questions essentielles doivent être résolues dans ce contexte : sur quels principes repose le codage des objets présents dans une scène visuelle, comment se construit l'espace de saillance propre à guider le regard du système, comment s'articulent ces mécanismes avec les informations contextuelles et comportementales.

Nous faisons l'hypothèse qu'une représentation partielle, simplifiée du monde extérieur est, dans un contexte situé et une vision interactionniste, suffisante pour le coder. Nous mettons ainsi l'accent sur la notion de code clairsemé et l'utilisation de pointeurs déictiques plutôt que sur le recours à des représentations exhaustives telles qu'elles ont pu être proposées dans une tradition mentaliste. Par ailleurs, ces représentations internes doivent permettre une classification adaptative des objets dépendant des attentes internes du système. La catégorisation est un processus qui se déroule en situation. La construction et la sélection dynamique de caractéristiques est inhérente au processus de catégorisation. Enfin, la détermination des points sur lesquels porter le regard dépend autant du contexte d'action que de la nature du stimulus.

Un premier système reposant sur ces principes a été construit dans le cadre de la thèse de Joseph Machrouh. Les premières étapes de codage de l'information ont été précisées avec le double objectif d'obtenir des codes minimisant la redondance des scènes naturelles et de construire un espace de projection permettant d'identifier les points d'intérêt d'une scène visuelle.

Nathalie Denquive a par ailleurs étudié l'utilisation de représentations similaires afin de catégoriser des scènes complexes. Il s'agit ici encore de savoir si une description de la scène réduite à un vecteur d'énergie dans un petit nombre de directions et de fréquences spatiales est suffisante pour caractériser un type de scènes. Le même type de travail est mené en parallèle dans le cadre d'une collaboration avec Antoine Cornuéjols et Michelle Sebag (LRI) (contrat BQR Université Paris XI) en utilisant des machines à vecteurs de support (SVM).

La dialectique invariants-variabilité se trouve au centre des activités perceptives. Nous développons une vision d'ensemble du problème, reposant sur la notion de multicatégorisation. Pour appréhender les structures du monde, il est nécessaire de bâtir des catégories. Mais l'opération de catégorisation, qui consiste à mettre plusieurs objets ou signaux dans une même catégorie, a pour corollaire la variabilité, puisque les objets ne sont jamais exactement identiques. Et la variabilité est la principale pierre d'achoppement rencontrée par les systèmes artificiels de reconnaissance visuelle ou auditive. La multicatégorisation vise à dépasser ce problème. Selon cette approche, à tout "objet " (au sens large : concret ou abstrait, visuel ou sonore) sont associées deux descriptions, l'une en termes de composants internes (descripteurs de bas niveau), l'autre en termes de rapports avec les autres objets (descripteurs de haut niveau). Chaque descripteur de haut niveau peut prendre plusieurs valeurs, chacune correspondant à une catégorie. Ainsi tout objet est vu de l'extérieur comme multicatégoriel, c'est-à-dire possédant plusieurs dimensions ou attributs. La variabilité se réduit alors, si l'on a pris en considération un nombre suffisant de descripteurs, à une variabilité résiduelle, représentant l'influence du hasard ou des descripteurs justement négligés parce qu'ils n'ont pas d'importance perceptive.

Cette approche s'étend à toute hiérarchie d'abstraction (plusieurs niveaux de descripteurs). La perception peut être vue comme un changement de niveau d'abstraction, les descripteurs propres à chaque niveau devenant de plus en plus indépendants les uns des autres à mesure que l'on progresse dans la hiérarchie. Percevoir c'est concilier, à un niveau quelconque de la hiérarchie, des informations - ascendantes, souvent incomplètes ou bruitées - venant des sens, avec des informations - descendantes et elles aussi partielles - venant des plus hauts niveaux de la cognition, et traduisant la plus ou moins grande prévisibilité de l'objet qui se présente à nos sens.

Le mise au point d'algorithmes de détermination de points d'intérêt sur une scène visuelle sera poursuivie. L'analyse des groupements de ces points d'intérêt servant de support à l'émergence de la notion d'objet sera développée. Nous nous attacherons à étudier la façon dont la détermination du contexte rend possible l'indexation des objets à l'aide de traits simplifiés.

L'approche active de la vision sera étendue aux applications sur des séquences video et à la vision robotique. L'acquisition d'un système de camera mobile et sa mise en oeuvre au cours de l'année 2001 puis d'un robot Khepera muni d'une caméra couleur de bonne résolution nous fournissent le moyen de préciser les conditions d'utilisation des processus d'exploration et des contrôles attentionnels dans un environnement réel.

Nous étudierons les conditions d'application des méthodes mises au point aux séquences video dans lesquelles le problème de la focalisation attentionnelle se pose d'une façon assez semblable à la vision robotique. Dans ce type d'application, les contraintes de temps réel interdisent le recours à des algorithmes complexes appliqués à la totalité de l'image. Les possibilités de sélection attentionnelle d'éléments pertinents de la scène ouvrent la voie à des traitements élaborés appliqués aux seules zones d'intérêt. En relation avec le thème 3, nous utiliserons les approches attentionnelles pour explorer des images radiologiques. La détermination de points d'intérêt devrait permettre d'élaborer une connaissance spatiale utile pour réaliser la mise en correspondance de coupes radiologiques successives. La caractérisation invariante des principaux organes sera également abordée en ayant recours aux techniques de codages mises au point à propos de la reconnaissance d'objets.

A terme, cette approche pourrait déboucher sur une automatisation partielle de la recherche d'anomalies permettant une analyse plus exhaustive des données de tomodensitométrie que celle qui est pratiquée aujourd'hui.

THÈME 3 : IMAGERIE MÉDICALE

A. Osorio, G. André, J. Atif, O. Bedelet, C. Soussen. J.-S. Liénard, S. Merran, X. Ripoche, V. Servois, P. Tarroux

L'objectif du thème Imagerie Médicale est d'effectuer des recherches en traitement d'images radiologiques tomodensitométriques pour aboutir à la reconstruction et à la mesure précise de volumes d'organes et de lésions. Malgré les progrès étonnants de l'informatique très peu de post traitement d'images est assuré aujourd'hui dans le monde médical, en particulier en ce qui concerne la mesure des volumes. Or tant pour le diagnostic que pour le suivi de patients cette mesure est indispensable. Plusieurs applications médicales nécessitent, de manière rédhibitoire, la connaissance de volumes. C'est notamment le cas d'apparition de lésions secondaires, de traitement de lithiases, de détection de calcifications vasculaires, de mesure du volume de lymphomes.

L'objectif finalisé de cette recherche est la conception, mise en oeuvre et implantation sur site d'un système informatique interactif capable de reconstruire et de mesurer des volumes. L'évolution très rapide des ordinateurs du type PC alliée à la diminution de leur coût et à leur ample diffusion dans les centres de radiologie nous a amenés à retenir ce matériel comme machine cible. La complexité des images radiologique rendant illusoire l'idée même d'une interprétation complètement automatisée, elle doit s'adapter aux exigences des centres d'imagerie médicale et au souhait des radiologues seuls maîtres dans le choix des régions à traiter et des interfaces à utiliser. Sous l'aspect traitement d'images, les données radiologiques constituent probablement à l'heure actuelle la seule source d'informations réellement tridimensionnelles, issues d'un capteur extérieur et dont la variabilité est notoire. Le caractère clairement pluridisciplinaire de cette activité fait qu'il est indispensable de mettre en place une interaction permanente entre les chercheurs et les radiologues.

Cette activité de recherche, commencée au LIMSI il y a plus de 8 ans, a conduit à la mise en oeuvre de sous-systèmes spécifiques orientés vers l'analyse d'images hépatiques, pulmonaires, rénales, vasculaires. La transplantation d'organes avec des donneurs vivants, la mise en place d'une nouvelle classification internationale des lithiases coraliformes, la localisation segmentaire et la mesure du volume de lésions hépatiques et pulmonaires et la mesure du volume de lymphomes sont les applications qui ont suscité le plus grand intérêt dans la communauté radiologique et qui ont conduit aux résultats les plus spectaculaires.

En 1999, en 2000 et en 2001 des Journées Internationales « Informatique et Imagerie Médicale : Présent et Avenir » (http://www.limsi.fr/ rubrique JIM), ont été organisées, sous l'égide de la Délégation Régionale du CNRS. La prochaine journée aura lieu à Orsay en septembre 2002. En 1999 et en 2000, 5 présentations à infoRAD (RSNA) ont été retenues. L'une d'entre elles a obtenu l'une des rares récompenses (Certificate of Merit) accordées dans cette manifestation. En 2001, deux présentations ont été retenues. Quatre thèses sont en cours de préparation sur ce sujet et une a été soutenue. En 2001 la Société Française de Radiologie (SFR) nous a demandé de faire partie du Comité d'Organisation d'Informag et d'animer une nouvelle activité en Imagerie 3D. Neuf contribution Internationales y ont été présentées. L'une de nos présentations a obtenu le prix Informag de la meilleure contribution à l'Imagerie radiologique (reconstruction et mesure du volume des lithiases coraliformes.

Plusieurs contributions dans le domaine de l'Imagerie 3D ont été présentées à des manifestations nationales et internationales, notamment aux Journées de Recherche en Imagerie Médicale du CERF et au Congrès de l'Association Française d'Urologie (AFU).

Ce thème de recherche constitue le centre de notre collaboration avec le « Computer Sciences Department » et l'Institut Beckman de l'Université d'Illinois (centre d'Urbana Champaign) dans le contexte des accords de collaboration existant avec le CNRS.

RELATIONS EXTERIEURES

Enseignement et diffusion des connaissances

Organisation de colloques

- Organisation à Orsay des 3^èmes Journées Informatique et Imagerie Médicale : Présent et Avenir (A. Osorio)

- Membre du Comité d'organisation « informag » des Journées Françaises de Radiologie (A. Osorio)

Participation à des comités éditoriaux

- C. d'Alessandro est rédacteur en chef de la revue « Traitement automatique des langues » (ATALA/HERMES).

Activités ou responsabilités d'enseignement liées à la Recherche

- J.S. Liénard est co-responsable du DEA SETI (Systèmes Electroniques de Traitement de l'Information), Université Paris XI (département de Physique). Il enseigne également dans le cadre du DEA Sciences Cognitives du département d'Informatique (cours d'option Perception Naturelle et Perception Artificielle avec P. Tarroux)

- A. Osorio est responsable et enseignant du module B4 du DEA SETI. Il est aussi enseignant en imagerie 3D dans le DU Imagerie Médicale de la Faculté de Médecine du Kremlin-Bicêtre

- P. Tarroux est responsable du DEA de Sciences Cognitives Université Paris XI. Il est responsable de l'option Intelligence Artificielle du Module « Méthodes Informatiques en Biologie ». Il enseigne également au DEA « Analyse des Génomes » et à l'Ecole Normale Supérieure.

- C. d'Alessandro est responsable du module « Traitement automatique de la parole » dans le DEA SETI (Paris XI), et du module de 3^èmeannée « Analyse et synthèse de la parole » à l'ENSTA (Ecole Nationale Supérieure des Techniques Avancées).

- Les membres du groupes sont fréquemment sollicités pour des jurys de thèse et d'HDR (une dizaine pour 2000-2001).

Participation à des séminaires

- C. d'Alessandro a été invité à plusieurs séminaires (Atelier d'histoire et de philosophie des sciences, Paris VI, Séminaires du Laboratoire d'acoustique musicale, Paris VI, Faculté Polytechnique de Mons, laboratoire TCTS).

- A. Osorio a participé aux Journées de Recherche en Imagerie Médicale du CERF (Comité des Enseignants de Radiologie de France) et à la Journée « L'informatique à l'usage du Radiologue de la FMP»

Actions de vulgarisation

- Participation de C. d'Alessandro à un bar des sciences dans le cadre de la « Fête de la science » en octobre 2001 à la Ferté-Alais.

- C. d'Alessandro a publié (à l'occasion de l'édition d'un ouvrage sur la synthèse de la parole) un disque compact audio (59 mn) qui regroupe des exemples sonores de quasiment tous les systèmes de synthèse de parole à partir du texte en Français, depuis l'origine jusqu'à 2001.

Relations nationales

Responsabilités institutionnelles

- J.S. Liénard est membre : du Comité Scientifique de l'IRCAM, de divers groupes de réflexion de l'Institut Bull (principalement Cerveaux et Machines, Technique et Clinique), du Comité Scientifique du Réseau d'Ile-de-France de Sciences Cognitives, du Comité de Pilotage du RISC (Réseau d'Information en Sciences Cognitives), du Conseil Ministériel de la Recherche (Ministère de la Culture et de la Communication), du Comité Scientifique de la Direction de la Musique et de la Danse (MCC), des CSE 61 de Cergy-Pontoise et 27 de Paris XI (suppléant), de la Commission d'Evaluation de l'INRIA (conseiller du Directeur de l'Inria).

- P. Tarroux est membre du CENECC (Centre d'Etude de la Cognition et des systèmes Complexes) de l'ENS et du groupe de réflexion Cerveaux et Machines de l'Institut Bull.

- C. d'Alessandro est membre de la Commission de Spécialistes de l'université Paris XI, 61^ème section, de la Commission Supérieure des Monuments Historiques (V^èmesection, orgues, instruments anciens, patrimoine campanaire) du Ministère de la Culture et de la Communication.

Relations scientifiques

- Collaboration avec le Laboratoire d'Acoustique Musicale, sur l'analyse, la synthèse et la perception de voix chantée (thèse de Nathalie Henrich co-encadrée par C. d'Alessandro).

- Collaboration avec France Télécom Recherche et développement, Lannion (2 thèses co-encadrée par C. d'Alessandro).

- A. Osorio est responsable des relations scientifiques pour la reconstruction et mesure de volumes et de lésions avec : la Fédération Mutualiste Parisienne (Paris), l'Institut Curie (Paris), le HIA du Val de Grâce (Paris), le CHU Hôpital Edouard Herriot (Hospices Civils de Lyon), le Centre Hospitalier Saint-Anne (Paris), le Centre Chirurgical Marie Lannelongue (Le Plessis Robinson).

Conventions de recherche et contrats

- J.S. Liénard et I. Vasilescu participent à l'action Cognitique "Variabilité de la parole" (avec R. Carré, ENST Paris, et J.M. Hombert, DDL Lyon, 2000-2002) ainsi qu'à l'action CNRS STIC-SHS ;SPMquot;Modélisations pour l'Identification des Langues;SPMquot; (2001-2004).

- Un contrat de recherche avec France Télécom Recherche et Développement élaboré en 2001 est en cours de signature (analyse de la qualité vocale).

- Contrat CIFRE avec REGINOV (A. Osorio)

Relations internationales

Responsabilités institutionnelles

- C. d'Alessandro est expert (reviewer) pour la Commission Européenne (contrat IST-RAA 1999-12585).

- A. Osorio est responsable CNRS dans le domaine Imagerie dans l'accord cadre CNRS Université d'Illinois à Urbana-Champaign.

Relations scientifiques

- Collaboration avec le Laboratoire de Théorie des Circuits et Traitement du Signal (Faculté Polytechnique de Mons) en synthèse de la parole.

- I. Vasilescu collabore avec I. Madison de l'université de Berkeley sur la perception des langues.

- Participation de C. d'Alessandro à de nombreux comités scientifiques et comités de lecture de conférences (Int. Conf Speech Prosody 2002, 4th ISCA Ws on Speech Synthesis, Eurospeech 2001, Int. Computer Music Conf 2001, ICSLP 2002, JEP 2000, 2002, TALN 2000, 2002), et à des rapports pour des revues (en 2000-2001, J. Acoust Soc. Am, Comp. Speech and Lang, IEEE Trans Speech and Audio, IEEE Trans. Biomed. Eng. Comp. and the Human., TAL)

Conventions de recherche et contrats

- Un contrat de diffusion de ressources linguistiques (dictionnaire phonétisé du Français, développé à l'occasion d'un contrat CNRS « Industries de la langue ») est en cours de signature avec ELRA (European Language Resources Agency).