Communication animale : bientôt un dialogue avec le cachalot ?

Un projet ambitieux tente de percer les secrets de la communication animale, grâce à l’utilisation de l’intelligence artificielle. Il s’agit d’interpréter les clics du cachalot, mais aussi de leur répondre. À l’instar de Dory dans Le Monde de Nemo qui prétendait « parler baleine », pourrons-nous bientôt entamer un dialogue avec un cachalot ? C’est le but du projet CETI.

Sommaire

Présentation par David Guber, le chef du projet CETI

L’origine farfelue du projet CETI pour comprendre le langage des cachalots

« Je ne connais pas grand-chose aux baleines. Je n’ai même jamais vu un cachalot de ma vie », déclare Michael Bronstein. Cet informaticien israélien, enseignant à l’Imperial College de Londres, en Angleterre, pouvait ne pas sembler le candidat idéal pour un projet impliquant la communication animale relative au cachalot. Mais ses compétences d’expert en apprentissage automatique pourraient être la clé d’un projet ambitieux qui a officiellement débuté en mars 2020 : un groupe interdisciplinaire de scientifiques a décidé d’utiliser l’intelligence artificielle (IA) pour décoder le langage de ces mammifères marins. Si le projet CETI (Cetacean Translation Initiative) réussit, ce serait la première fois que nous comprendrions réellement ce que les animaux racontent et peut-être même que nous pourrions entamer une conversation avec eux.

Tout a commencé en 2017, lorsqu’un groupe international de scientifiques a passé un an ensemble à l’université Harvard à Cambridge, dans le Massachusetts. Cet événement avait pour le cadre la Radcliffe Fellowship, un programme qui promet « une occasion de s’éloigner des routines habituelles » (sic). Un jour, Shafi Goldwasser, une informaticienne et experte en cryptographie (également originaire d’Israël), passa par le bureau de David Gruber, un biologiste marin de la City University of New York. Shafi Goldwasser venait d’être nommée nouvelle directrice du Simons Institute for the Theory of Computing de l’université de Californie à Berkeley. Elle avait entendu une série de cliquetis qui lui rappelaient le bruit d’un circuit électronique défectueux, mais aussi des bribes de code Morse.

« C’est ainsi que les cachalots se parlent entre eux », lui dit Gruber. Ce à quoi Shafi Goldwasser rétorqua : « Peut-être devrions-nous lancer un projet dans lequel nous traduirions les sons du cachalot en quelque chose que nous, les humains, pourrions comprendre. J’ai dit ça spontanément, sans penser qu’il me prendrait au sérieux ! ».

La communication animale au travers des clics du cachalot

Les cachalots sont présents dans tous les océans de notre planète, mais leurs dialectes sont spécifiques à chaque groupe social. La séquence de clics échangés par les cachalots dans la vidéo ci-dessus représente le langage des cachalots qui vivent dans les eaux des Caraïbes au large de l’île de la Dominique.

La concrétisation d’un projet très sérieux sur la communication animale

Lors d’un dîner, Shafi Goldwasser et David Gruber ont présenté l’idée à Michaël Bronstein. Il travaillait alors sur les récentes avancées du traitement du langage naturel (NLP – Natural Language Processing), une branche de l’IA qui traite de l’analyse automatisée de la parole écrite et parlée, jusqu’à présent uniquement consacrée au langage humain. C’est à la suite de cette soirée qu’il proposa d’adapter ses recherches à la communication animale.

Michaël Bronstein était convaincu que les codas, comme on appelle les brefs énoncés des cachalots, possèdent une structure qui se prête à ce type d’analyse. Par chance, David Gruber connaissait un biologiste, Shane Gero, qui enregistrait depuis 2005 un grand nombre de codas de cachalots dans les eaux entourant l’île de la Dominique, dans les Caraïbes.

Michaël Bronstein commença par appliquer quelques algorithmes d’apprentissage automatique aux données. « Ils semblaient très bien fonctionner, du moins pour certaines tâches relativement simples », explique-t-il. Pour une analyse plus approfondie, les algorithmes avaient besoin de plus de contexte et de données, c’est-à-dire des millions de codas de baleines.

Coda (codas au pluriel) est le même mot en anglais qu’en français. En phonétique, il s’agit de la partie de la syllabe se terminant par une consonne, mais il faut plutôt l’entendre sous son acception musicale, appliquée aux clics des cachalots, comparés aux mesures qui forment la conclusion d’un morceau de musique, ainsi que les séquences de notes qui composent des « phrases » musicales.

Communication animale cachalots — © Amanda Cotton/Project CETI

Que définit-on par communication animale ?

Les animaux possèdent-ils un langage ? « Les animaux communiquent, mais ils ne parlent pas » affirmait le biologiste autrichien Konrad Lorenz, l’un des pionniers de la science du comportement animal. Mais ses études remontent à 1949 et, si elles nous ont permis d’en apprendre beaucoup sur le comportement animalier, nous savons aujourd’hui que ses assertions sur le langage des animaux étaient erronées.

Les animaux communiquent et il est même prouvé que les cétacés possèdent des dialectes qu’ils se transmettent par héritage et qui ne sont pas forcément compréhensibles par d’autres groupes vivant dans une autre zone.

Les études de Karsten Brensing sur le langage animalier

« Je pense plutôt que nous n’avons pas encore regardé d’assez près », explique Karsten Brensing, un biologiste marin allemand qui a écrit de multiples ouvrages sur la communication animale. Il est convaincu que les énoncés de nombreux animaux peuvent être qualifiés de langage.

– Tout d’abord, le langage a une sémantique. Cela signifie que certaines vocalisations ont une signification fixe qui ne change pas. On sait par exemple que le geai de Sibérie est une espèce d’oiseau qui possède un vocabulaire d’environ 25 cris, dont certains ont une signification fixe.

– La deuxième condition est la grammaire : les règles permettant de construire des phrases. Pendant longtemps, les scientifiques étaient convaincus que la communication animale était dépourvue de toute structure de phrase. Mais, en 2016, des chercheurs japonais ont publié dans Nature Communications une étude sur les vocalisations des mésanges charbonnières. Dans certaines situations, les oiseaux combinent deux cris différents pour s’avertir mutuellement de l’approche d’un prédateur. Ils ont réagi lorsque les chercheurs leur ont fait écouter cette séquence. En revanche, lorsque l’ordre des cris était inversé, les oiseaux réagissaient beaucoup moins.

Troisième critère : les vocalisations d’une espèce animale ne peuvent être qualifiées de langage si elles sont totalement innées. Lorenz pensait que les animaux naissaient avec un répertoire d’expressions et n’apprenaient pas grand-chose au cours de leur vie. Or, il est prouvé chez de nombreux animaux que le langage appartient à l’acquis. Les jeunes apprennent un nouveau vocabulaire, développent des dialectes et sont identifiés par leur nom. Certains oiseaux apprennent même à imiter les sonneries des téléphones portables. Les dauphins acquièrent des sifflements individuels qu’ils utilisent comme un identifiant pour eux-mêmes, presque comme un nom. Et que dire des perroquets…

Femelle cachalot — Une femelle cachalot dans les profondeurs de l’océan © Amanda Cotton/Projet CETI

Pourquoi s’intéresser prioritairement à la communication animale chez le cachalot ?

Les clics du cachalot constituent des candidats idéaux pour tenter de décoder leur signification. D’abord, contrairement aux sons continus produits par d’autres espèces de baleines, ils sont faciles à traduire en 1 et en 0, car ils émettent de brefs clics. D’autre part, ces animaux plongent dans les plus grandes profondeurs de l’océan et communiquent sur de grandes distances. Ils ne peuvent donc pas utiliser le langage corporel et les expressions faciales, qui sont des moyens de communication animale importants pour de nombreuses autres espèces.

« Il est réaliste de supposer que la communication du cachalot est principalement acoustique », déclare Michaël Bronstein. Le cachalot possède le plus gros cerveau du règne animal, six fois plus gros que le nôtre. Lorsque deux de ces animaux discutent entre eux pendant une période prolongée, ne devons-nous pas nous demander s’ils ont quelque chose à se dire ? Se donnent-ils des conseils sur les meilleures zones de pêche ? Les mères cachalot échangent-elles des histoires sur l’éducation de leur progéniture, comme leurs homologues humains ? Selon les chercheurs du CETI, cela vaut la peine d’essayer de le découvrir !

Les méthodes d’apprentissage

Apprendre une langue inconnue est plus facile s’il existe une référence comme la fameuse pierre de Rosette. Cette stèle, découverte en 1799, contient le même texte en trois langues et fut la clé du déchiffrage des hiéroglyphes égyptiens. Bien entendu, une telle chose n’existe pas pour le règne animal. Nous ne disposons ni d’un dictionnaire homme-baleine ni d’un livre contenant les règles grammaticales de la langue du cachalot.

Mais il existe des moyens de contourner ce problème. De toute évidence, les enfants apprennent leur langue maternelle sans ces outils, simplement en observant la langue parlée autour d’eux. Les chercheurs ont conclu que ce type d’apprentissage est essentiellement statistique : l’enfant se souvient que le mot « chien » est souvent prononcé lorsque l’animal entre dans la pièce, que certains mots sont souvent utilisés en relation avec d’autres, qu’une séquence spécifique de mots est plus probable qu’une autre…

Au cours des dix dernières années, les méthodes d’apprentissage automatique ont imité ce type d’apprentissage. Les chercheurs ont alimenté de grands réseaux avec d’énormes quantités de données linguistiques. Et ces réseaux ont pu trouver des structures dans les langues à partir d’observations statistiques, sans qu’on leur dise quoi que ce soit sur le contenu.

Les modèles de langage

Les modèles de langage, dont le plus connu est GPT-3 développé par la société OpenAI, en sont un exemple. Ils constituent des machines à compléter. GPT-3, par exemple, reçoit le début d’une phrase et la complète mot à mot, un peu comme les suggestions que font les smartphones lorsque nous tapons des textos, mais de manière beaucoup plus sophistiquée.

En traitant statistiquement d’énormes quantités de textes tirés d’Internet, les modèles de langage savent non seulement quels mots apparaissent fréquemment ensemble, mais ils apprennent également les règles de composition des phrases. Ils créent des phrases correctes, souvent d’une qualité remarquable. Ils sont capables de rédiger de faux articles d’actualité sur un sujet donné, de résumer des textes juridiques complexes en termes simples et même de traduire un texte d’une langue à une autre.

Ces prouesses ont un prix : elles nécessitent d’énormes quantités de données. Les programmeurs ont entraîné le réseau neuronal de GPT-3 avec environ 175 milliards de mots. En comparaison, le projet du biologiste Shane Gero sur les cachalots de la Dominique a recueilli moins de 100 000 codas de cachalots. La première tâche du nouveau projet de recherche est donc d’élargir considérablement cette collection, dans le but de collecter quatre milliards de mots (bien que personne ne sache encore ce qu’est un « mot » dans le langage des cachalots !).

Si l’idée de Michaël Bronstein fonctionne, il est tout à fait réaliste de développer un système analogue aux modèles de langage humain qui génère des énoncés grammaticalement corrects du cachalot. L’étape suivante serait un chatbot interactif qui tenterait d’engager un dialogue avec des cachalots. Bien sûr, personne ne peut dire aujourd’hui si les animaux l’accepteraient comme partenaire de conversation. Peut-être lui répondraient-ils simplement : « Arrête de raconter des bêtises ! », plaisante Michaël Bronstein.

Mère cachalot et son baleineau — Il ne fait aucun doute que cette mère cachalot et son baleineau communiquent, mais les chercheurs ignorent encore ce qu’ils se racontent © Amanda Cotton/Projet CETI

Le schéma du processus CETI pour comprendre le langage des cachalots

Les chercheurs espèrent que l’intelligence artificielle leur donnera la clé pour comprendre la communication des cachalots selon le schéma repris par cette illustration du projet CETI.

CETI communication animale du cachalot — © CETI

Tenir compte du contexte est indispensable pour comprendre la communication animale

Mais même si l’idée fonctionne, l’inconvénient de tous les modèles de langage est qu’ils ne savent rien du contenu de la langue dans laquelle ils discutent. Il serait ironique que les chercheurs créent un robot capable de converser couramment avec un cachalot, mais qu’ils n’en comprennent pas un traître mot.

C’est pourquoi ils veulent annoter les enregistrements vocaux avec des données sur le comportement des cachalots lorsque les clics sont enregistrés : où étaient les animaux, qui parlait à qui, quelle était leur activité… Le défi consiste à trouver un moyen automatisé d’effectuer au moins une partie de ces millions d’annotations.

Il reste encore beaucoup de moyens technologiques à mettre au point pour obtenir des capteurs aptes à enregistrer chaque cachalot, tout en surveillant sa position et son attitude. Ces éléments sont nécessaires pour attribuer clairement les sons individuels à un animal spécifique.

Un financement à moyen terme pour décrypter la communication animale

Le projet CETI a obtenu un financement de cinq ans dans le cadre du projet Audacious géré par TED, une très célèbre organisation de conférences dans le monde entier. Plusieurs organisations participent au projet, notamment la National Geographic Society et le Computer Science and Artificial Intelligence Laboratory du Massachusetts Institute of Technology (MIT).

Il faudra bien sûr plus de 5 ans pour avancer sur le sujet de la très complexe communication animale. En 2021, le projet CETI n’en est qu’à ses balbutiements, mais il s’avère passionnant. Affaire à suivre bien sûr…

Découvrez le langage des orques dans les articles Interpréter le chant de l’orque, Plonger avec des orques pour comprendre leurs vocalises et Le chant des orques décrypté par un océanographe.

Le projet CETI décrypté par Shane Gero et Michaël Bronstein

Dans la vidéo qui suit, Shane Gero explique le projet CETI en précisant les deux natures des sons émis par le cachalot : les clics d’écholocation pour « voir » dans le noir des profondeurs et les codas destinés à la communication entre les membres du groupe.

Michaël Bronstein revient sur les progrès colossaux effectués grâce à l’IA et insiste sur les espoirs qu’il place dans ce projet d’une ampleur jamais atteinte jusque-là pour décrypter la communication animale entre les cachalots.