Les robots apprennent le partage !

2
1353


La notion de ¬ę s√©lection de parent√®le ¬Ľ (kin selection) s’explique assez simplement : dans chaque esp√®ce, les individus privil√©gient les comportements de coop√©ration avec leurs parents g√©n√©tiques les plus proches car en se d√©vouant ainsi, ils favorisent la propagation de leurs propres g√®nes. Cette r√®gle est connue sous le nom de ¬ę Loi de Hamilton ¬Ľ.
Autrement dit, tout √™tre qui en aide un autre le fait par int√©r√™t ! ūüôĀ
William Donald Hamilton √©tait un biologiste britannique de l’√©volution. Il a principalement contribu√© √† cette th√©orie de la s√©lection de parent√®le.
En 1964, il publie un article dans le Journal of Theoretical Biology, intitul√© ¬ę The General Evolution of Social Behavior ¬Ľ dans lequel il pr√©sente sa th√©orie comme une solution √† l’un des grands probl√®mes de la th√©orie de l’√©volution (de Charles Darwin) :

Pourquoi existe-t-il des comportements altruistes chez les primates, alors que de tels comportements sont ¬ę co√Ľteux ¬Ľ et souvent dangereux pour leurs acteurs ?

Les h√©ros de nos s√©ries t√©l√©vis√©es mettraient donc leur vie en jeu pour sauver le monde pour leur propre int√©r√™t ? Peut-√™tre le besoin reconnaissance. ūüôā
Les chercheurs de l’√Čcole Polytechnique F√©d√©rale de Lausanne ont voulu v√©rifier les r√®gles de Hamilton qui se r√©sument en deux postulas :

1. La valeur s√©lective d’un individu n’est pas seulement proportionnel √† son succ√®s personnel en mati√®re de reproduction mais √©galement √† celui de ses tiers apparent√©s (g√©n√©tiquement proches). La somme de la valeur s√©lective et de la valeur s√©lective indirecte est baptis√© valeur s√©lective globale (inclusive fitness) par Hamilton.
2. Un comportement sera qualifi√© d’altruiste envers un tiers s’il permet l’augmentation de la valeur s√©lective propre de ce dernier. Par cons√©quent, d’apr√®s le postulat (1), un comportement altruiste envers un tiers apparent√© permet d’augmenter la valeur s√©lective globale.

Pour cela, ils ont imagin√© un groupe de petits robots √† deux roues, programm√©s pour apprendre le partage d’une mani√®re un peu particuli√®re. Ils doivent partager en optimisant leur consommation ; l’une des donn√©es prises en compte est l’√©nergie √©conomis√©e si le robot aid√© le fait √† son tour.
Chaque robot a un comportement d√©fini selon des g√®nes num√©riques (un code informatique simple) qui leur permettent de se mouvoir dans leur environnement r√©el. L’√©quipe de chercheur a plac√© ces robots sur une table o√Ļ se trouve de petits cylindres repr√©sentant de la nourriture. Plus ils d√©cident de donner √† leurs semblables, plus leurs g√®nes √©voluent (incluant le g√®ne de l’altruisme).
La vid√©o ci-dessous montre le r√©sultat de l’exp√©rience plut√īt concluante :

Certains membres de l’√©quipe de Shyrobotics (dont moi-m√™me), ont travaill√© un projet de ce type.
Le Darwin’s World est un jeu de simulation d’un monde ¬ę vivant ¬Ľ qui met en comp√©tition deux esp√®ces virtuelles de cr√©atures. Le but de chaque esp√®ce est de rallier les cr√©atures ennemies √† son camp.
Pour cela, chaque cr√©ature a un nombre d’actions limit√© par tour : Avancer, tourner sur elle m√™me et infecter. Les actions que la cr√©ature choisit de faire dans chaque situation d√©finissent son code g√©n√©tique. Chacune des deux esp√®ces qui entre en jeu est r√©git par son propre code g√©n√©tique.
Nous avons repris les r√®gles de ce jeu en consid√©rant l’une des esp√®ces comme l’ennemie dont le comportement ne change pas, et une liste d’esp√®ces dont le code est g√©n√©r√© al√©atoirement qui correspond √† la population initiale des algorithmes √©volutionnistes.
Nous avons d√©cid√© d’√©valuer les cr√©atures en r√©cup√©rant le nombre de points accumul√© par chacune d’elles au cours d’un affrontement contre l’ennemie dans Darwin’s World.
L’objectif du projet √©tait donc d’impl√©menter le code de mutation en langage C et d’√©tudier le graphique d’√©volution des populations. Nous avons aussi d√©cid√© d’√©crire un petit logiciel qui nous permettrait de visionner l’une des parties jou√©es par les cr√©atures.
Le r√©sultat de notre travail nous a impressionn√©s ! Non seulement la cr√©ature produite par notre logiciel arrivait √† battre la cr√©ature √©crite par la main d’un homme, mais on a pu observer un comportement de collaboration entre nos cr√©atures. Nous n’avions pourtant √† priori pr√©vu aucun moyen de communication.
Il vous est possible de parcourir le rapport que nous avions rédigé ici.
Voici une vid√©o qui illustre l’√©volution des esp√®ces au cours des parties :

Darwin’s World d’apr√®s l’ESIEA from Shy Robotics on Vimeo.

Sources :
Wikipédia bibliographie
Wikipédia définition
PLoS Biology

2 Commentaires

  1. C’est √† la fois int√©ressant et effrayant… Un robot serait donc capable de reproduire la logique des √©motions humaines ? J’esp√®re que le cerveau est plus compliqu√© que √ßa quand m√™me.

    • D’apr√®s les diff√©rentes √©tudes que j’ai lu, la complexit√© du cerveau repose sur des principes simples. Donc ici, on a cern√© l’un de ces principes, mais nous sommes loin d’avoir introduit toute la complexit√© du cervaux. Rassur√© ?

Laisser un commentaire