Adaptation d’un système artificiel à un environnement naturel

 

Michel Bret, professeur émérite des universités

Colloque « Corps en mutation », Université de Toulouse-le Mirail, mars 2006

 

 

Mots clés : interactivité, mimétisme, réseaux neuronaux, vie artificielle

 

Résumé

 

            Les récentes avancées des neurosciences, de la robotique et des systèmes temps réel ont montrés la nouvelle importance prise par le concept d’interactivité avec le couple perception-action à l’œuvre aussi bien chez les organismes vivants que dans les systèmes artificiels construits sur des modèles biologiques. Le connexionnisme (avec les réseaux neuronaux) et l’évolutionnisme (avec les algorithmes génétiques et la programmation génétique) reposent le rapport du créateur avec son œuvre. Celle-ci, douée d’une perception et d’une action artificielles, fait preuve d’une véritable autonomie.

 

            A travers des expérimentations sur le mimétisme, je tenterai de montrer que des organismes artificiels sont capables de s’adapter spontanément à un environnement naturel imprévu comme peut l’être la disposition de la salle de conférence.

            Plus précisément un acteur de synthèse sera construit inter activement sous la forme d’un corps anthropomorphe situé dans un environnement simulé obéissant aux lois de la physique. Il ne s’agit ni d’un clone ni d’un robot, mais d’un organisme hybride, entre le vivant et l’artificiel, muni d’organes de perception, d’organes moteurs et d’un système nerveux central. Le but de l’expérimentation sera de montrer que, grâce à la plasticité des réseaux neuronaux, l’acteur peut se modifier et s’auto organiser, de façon autonome, afin de remplir une fonction de mimétisme.

Le système perceptif est construit en connectant une webcam (considérée comme un « œil ») à une rétine artificielle (l’image mémoire de la caméra). Cette rétine est ensuite connectée à la couche d’entrée d’un réseau neuronal, l’activation qui en résulte se propage (sous forme d’influx nerveux) à travers les synapses des neurones constituant les différentes couches cachées (sorte de « cortex ») pour finalement atteindre la couche de sortie constituée de neurones moteurs. Ceux-ci sont alors connectés au système musculaire de l’acteur artificiel qui se met à bouger en fonction des informations lumineuses qu’il reçoit sur sa rétine.

            Ayant constaté que ces mouvements sont désordonnés, la deuxième partie de l’expérience consistera à « apprendre » au réseau à imiter des gestes qu’on lui montre. Pour cela on mémorise des « couples d’apprentissage » sous la forme d’une position montrée (devant la caméra) et d’une position interprétée (par l’acteur artificiel), puis on lance un apprentissage qui a pour but de modifier les valeurs des synapses afin que les positions interprétées correspondent le mieux possible aux positions montrées. A l’issu de cet apprentissage, non seulement l’acteur est capable d’exécuter correctement les positions montrées, mais il est en outre capable de donner des interprétations cohérentes de gestes qu’on ne lui a pas appris (propriété de généralisation des réseaux neuronaux).

            Une deuxième expérimentation sera tentée consistant à saisir, non plus des positions arrêtées, mais des séquences de mouvements continus.

            Les applications d’un tel système à la chorégraphie, au théâtre, au cirque ainsi qu’a tous les arts vivants seront soulignées.

 

            Enfin des systèmes préalablement entraînés à interpréter de la musique seront montrés sous forme d’installations interactives crées par l’auteur.

 

1 Les deux interactivités

 

Avec Edmond Couchot et Marie-Hélène Tramus nous distinguons plusieurs types d’interactivité [1] :

La « première interactivité », ou interactivité de commande, qui est celle de la simple boucle rétroactive de la cybernétique et qui est à la base de la plupart des systèmes interactifs.

Puis la « seconde interactivité » (par analogie avec la seconde cybernétique) qui apparaît dès lors que le système qui la produit est capable de se modifier lui-même au cours d’un apprentissage par lequel il interagit avec son environnement afin de s’y adapter. Il s’agit bien là d’un comportement que l’on pourrait qualifier d’ « intelligent » et qui traduit le concept d’autopoiése introduit par Francisco Varela[2].

 

2 Neurones et création

 

En 1995, à la suite de Karl Sims [3], de Van de Panne et Fiume [4], et sensibilisé par l’artiste américain Michael Tolson à la technique des réseaux neuronaux, je m’intéressais au connexionnisme et à ses applications artistiques, en particulier dans le domaine de l’interactivité [5].

La vie a résolu le problème de l’adaptation des organismes à leur environnement en inventant les systèmes nerveux centraux, constitués de neurones massivement interconnectés au moyen de liaisons modifiables par l’expérience [6].

L’informatique permet de simuler de tels systèmes au moyen des « réseaux neuronaux » [7]. Prenons l’exemple des réseaux multi couches à apprentissage supervisé. Il s’agit de construire des êtres virtuels munis :

1) D’un système perceptif (dont les organes sont des capteurs qui se projettent sur les neurones de la couche d’entrée du réseau neuronal).

2) D’un système moteur (muscles d’un modèle dynamique de l’être de synthèse commandés par les neurones moteurs, qui sont ceux de la couche de sortie du réseau).

3) De plusieurs couches cachées figurant le « cortex » du cerveau artificiel.

4) Enfin d’un protocole d’apprentissage permettant d’entraîner le réseau lors d’expérimentations au cours des quelles les poids des connexions sont modifiés (par l’algorithme dit de la « rétropropagation de l’erreur ») afin de satisfaire de mieux en mieux aux directives du « professeur » chargé d’éduquer le réseau.

 

3 Construction d’un organisme artificiel vivant

 

3-1 Commande d’un personnage virtuel

 

Une simple Web Cam nous servira d’organe visuel (œil artificiel) que nous allons connecter au personnage virtuel constitué d’un squelette articulé sur lequel ont été attachés des muscles dynamiques, sur l’ensemble de ces deux structures a été tendue une peau. Lorsque l’on communique une excitation aux muscles (en utilisant divers capteurs : Souris, gyroscopes, caméra, data suit, etc..), le squelette bouge, les muscles et la peau se modifient automatiquement.

Ce dispositif constitue une installation interactive de premier niveau (interactivité de commande) dans laquelle la simulation ne fait qu’obéir aux ordres de l’expérimentateur.

 

3-2 Schéma perception-action

 

Si nous connectons l’œil-caméra à la rétine du personnage virtuel celui-ci ne voit pas pour autant, il lui manque en effet des éléments indispensables à la perception : un nerf optique, un cerveau et des sorties lui permettant d’agir. Dotons-le d’un cerveau artificiel, celui-ci est un réseau neuronal ainsi construit:

Une couche d’entrée constituée d’autant de neurones que la rétine contient de pixels, chacun de ceux-ci envoie au neurone qui lui est connecté un signal proportionnel à l’intensité lumineuse arrivant en ce point de la rétine.

D’une ou plusieurs couches cachées.

D’une couche de sortie dont chaque neurone est connecté à un muscle du personnage.

Les neurones sont connectés deux par deux par des synapses dont les poids (qui servent à moduler l’influx nerveux transitant entre les neurones) sont stockés dans une matrice.

L’image d’un objet déplacé devant la rétine se projette sur les neurones de la couche d’entrée dont l’activation, passée aux neurones moteurs de sortie (via la couche cachée)  agissent sur les muscles du personnage virtuel et le font bouger.

Ce dispositif constitue une installation interactive de deuxième niveau (bâtie sur le schéma perception-action) dans laquelle la simulation est le résultat d’une perception artificielle.

La matrice est initialisée aléatoirement, les mouvements sont donc arbitraires et, bien que produits par l’image, ils ne semblent pas avoir de relation avec elle

 

3-3 Apprentissage supervisé

 

Lorsqu´une image est présentée en entrée, le corps prend une position qui dépend de la matrice des poids et, lorsque cette image change, c’est à dire lorsque l’œil regarde, le corps bouge.. Nous nous proposons d’affecter à cet acteur virtuel la capacité d’imiter. Pour cela nous construisons des couples d’apprentissage sous la forme d’une image (la photo d’un expérimentateur réel prenant une certaine position) et d’une configuration du corps virtuel reproduisant cette position. Puis nous entraînons ce réseau par l’algorithme de la rétropropagation de l’erreur de façon à ce qu’il reconnaisse les positions montrées. A l’issu de cet entraînement, grâce à la propriété de généralisation des réseaux neuronaux, ce réseau est capable de reconnaître, non seulement les positions apprises, mais encore toutes les positions proches de celles-ci et, même, des positions non apprises.

           

            L’interface graphique permet de visualiser simultanément les positions saisies par la caméra (sous forme de petites photos), les positions correspondantes du personnage virtuel (sous forme d’un modèle 3D) et le réseau en activité, avec sa couche d’entrée connectée à la rétine (les pixels de l’image caméra), sa couche cachée et sa couche de sortie connectée aux muscles du personnage virtuel. Des segments entre les couches figurent l’influx nerveux circulant entre les neurones, leur couleur est proportionnelle à ce signal. La matrice des poids synaptiques est également affichée sous forme d’un tableau de pixels dont les éclairements sont proportionnels à leurs valeurs.

            Lors de l’apprentissage, la courbe d’erreur reproduit les pérégrinations de l’algorithme d’apprentissage, montrant de nombreuses hésitations et même de fausses pistes, rapidement abandonnées. Initialement de 75% , l’erreur tombe en dessous des 50% après une vingtaine d’essais, elle n’est plus que de 26% après 38 essais , après 210 essais l’erreur est tombée en dessous de 2%, ce qui est un excellent apprentissage.

            La visualisation du réseau en action montre que celui-ci est capable de reconnaître une position approximative prise par un acteur réel devant la caméra.

            Notons que « imiter » ne signifie pas nécessairement « faire la même chose ». Par exemple nous pouvons donner des couples d’apprentissages arbitraires pour apprendre au personnage virtuel à se lever quand on se baisse ou à se plier quand on s’étend.

            Une utilisation intéressante de ce système consisterait à le confier à un chorégraphe qui entraînerait le personnage virtuel à danser dans un certain style.

            Une autre application consiste à munir le personnage virtuel simultanément de plusieurs sens, par exemple l’ouie et la vue, en connectant une caméra vidéo et un signal audio aux entrées de un ou plusieurs réseaux neuronaux. J’ai réalisé une telle installation interactive proposant aux spectateurs de danser avec un personnage virtuel sur une musique qu´ils entendent tout deux. Il en résulte une mise en résonance des deux danseurs (réel et virtuel) entre eux et avec la musique.

 

3-4 Apprentissage non supervisé

 

            En réalité les choses ne se passent pas ainsi et il n’est pas toujours nécessaire q’un « professeur », connaissant les réponses, dirige l’apprentissage. Il est beaucoup plus intéressant d’accroître encore l’autonomie du personnage virtuel en lui conférant une capacité d’auto apprentissage, ou encore d’apprentissage non supervisé, lui permettant de découvrir par lui-même les régularités de son environnement. Si l’on saisit, non plus des positions, mais des mouvements, l’information arrivant aux neurones d’entrée est un flux donnant, par propagation de l’influx nerveux à travers les diverses couches du réseau neuronal, un flux de sortie activant les muscles du personnage et le mettant ainsi en mouvement. En faisant l’hypothèse que l’adaptation est réussie si ces deux flux sont « cohérents » (ce qui revient à dire que l’homéostasie du système est satisfaite si ses actions sont cohérentes avec les perceptions qu’il en a), nous avons là un moyen de mesurer l’erreur commise par l’apprentissage en comparant ces deux flux ; j’ai par exemple utilisé avec succès la différence de leurs phases, et j’ai donné le nom de « cohérence de flux » à cette méthode.

 

4 Conclusion

 

            Je crois avoir montré expérimentalement que l’interactivité, loin de se réduire à un simple schéma stimulus-réponse, s’apparente au schéma perception-action à la base des comportements les plus évolués des êtres vivants qui fait intervenir un système nerveux dont la plasticité lui permet de se transformer et de s’adapter à un environnement par apprentissage. Ainsi se trouve  dépassée, je pense, l’opposition traditionnelle entre une soit disant rationalité scientifique ou technique et une prétendue intuition artistique : Finalement, tout ceci n’est qu’une affaire de neurones…


[1] M.-H. Tramus, M. Bret, E. Couchot , La seconde interactivité, in Arte e vida no século XXI, Organizadora Diana Domongues, UNESP, Brasil (2003).

[2] F.J. Varela Connaitre - Les sciences cognitives, tendances et perspectives, Ed. du Seuil, 1989

[3] Karl Sims, Evolving Virtual Creatures, in Computer Graphics, 15-22, 1994.

[4] Michiel Van de Panne, Eugène Fiume, Sensor-Actuator Networks, in Computer Graphics, 335-342, 1993.

[5] M. Bret, Virtual Living Beings, in Lecture Notes in Artificial Intelligence, Virtula Worlds 119-134, Ed. Jean-Claude Heudin, Springer 2000.

[6] Jean Pierre Changeux, L’homme neuronal, Fayard, 1983

[7] Hervé Abdi: Les réseaux de neurones, Presses Universitaires de Grenoble 1994.