_____________________
Objet
Quelle que soit l'approche adoptée, la Reconnaissance des Forme revient toujours à construire et utiliser une partition unique de l'ensemble des signaux possibles. Ce paradigme réducteur - plusieurs signaux dans une même classe exclusive - porte en lui- même la notion de variabilité, pierre d'achoppement des systèmes de reconnaissance. Nous proposons un paradigme plus large, le Traitement des Formes, qui met en oeuvre à divers niveaux de structuration une description complète de ces signaux. La prise en compte simultanée de tous les aspects perceptifs du signal permet de trouver les régularités structurales cachées dans un ensemble de signaux. Le but est double : il s'agit d'une part de dépasser les contraintes actuellement imposées aux systèmes de reconnaissance tout en simplifiant la phase d'apprentissage, d'autre part d'élaborer un modèle fonctionnel de la perception applicable à diverses modalités perceptives.
Description
L'approche proposée se traduit pratiquement par l'idée qu'il faut chercher à reconna^tre simultanément tous les aspects perceptibles du signal. Ainsi la reconnaissance de la parole implique la reconnaissance simultanée des éléments linguistiques (segments, mots), des caractéristiques du locuteur, de sa voix et de la situation d'élocution ; la reconnaissance de scènes visuelles implique la reconnaissance simultanée des objets, de leurs caractéristiques intrinsèques, des conditions d'éclairement, de la position de l'observateur et des caractéristiques du système optique. Par <<description complète>> nous entendons un ensemble de descripteurs adaptés au niveau d'abstraction considéré et tels que leur spécification permette de reconstruire un signal perceptivement identique à l'original. Les descripteurs peuvent être de deux sortes : ils représentent soit des éléments du niveau considéré (<<quoi>>), soit la position de ces éléments dans un espace propre à ce niveau (<<ou>>). L'apprentissage repose sur la coopération de plusieurs analogies. Une analogie peut être décrite par la formulation <<selon la propriété X, A est à B ce que C est à D>>. Concrètement ce terme désigne la transformation d'un exemple en un autre lorsque seul varie un descripteur de haut niveau. Ce processus d'<<induction analogique>> permet, contrairement aux méthodes traditionnelles de Reconnaissance des Formes, de calculer toutes les variantes possibles des signaux auxquels on s'intéresse, au lieu de supposer qu'elles ont toutes été acquises lors de la collecte des données d'apprentissage.
Résultats et perspectives
Les principaux aspects du Traitement des Formes ont fait l'objet de plusieurs publications, dont (1) ci-dessous. Le processus d'induction analogique a été mis en oeuvre sur des exemples-jouets (ci-contre) dans lesquels les transformations apprises par le système sont des permutations partielles de variables booléennes. Actuellement le programme fonctionne avec des ensembles plus étendus (plusieurs milliers d'exemples) et trois types d'applications sont à l'étude, dans les domaines de l'analyse de la parole (voyelles), de l'analyse de scènes visuelles constituées d'objets simples, et du passage de textes simples à leur représentation conceptuelle.
Référence
[1] J.S. Liénard : "From speech variability to pattern processing : a non-reductive view of speech processing", in "Levels in Speech Communication : Relations and Interactions ". Eds J. Schoentgen, J-M. Ramlot, C. Sorin, H. Meloni and J. Mariani, Elseviers Science Publishers, 1995.
Gpe Taitement du Langage Parlé | Dpt CHM |
Sommaire
|
Présentation |