Ce robot apprend ses fonctions d’assistant tout seul grâce au Web

Google a mis au point un robot domestique dont l’IA est capable de comprendre des phrases et d’y réagir correctement sans jamais avoir été programmé pour cela. Le robot s’appuie sur un puissant modèle de langage allant chercher les informations nécessaires sur le Web.

Énoncer la commande vocale « J’ai faim » à un robot pour qu’il rapporte quelque chose à manger, cela pourrait sembler presque normal ou du moins faisable en 2022. Et pourtant, lorsque l’on sait que le robot en question n’a jamais été programmé pour comprendre ce qu’il faut faire pour répondre à cette requête, cela reste très impressionnant.

Ce robot domestique, issu des laboratoires de Google et conçu par Fei Xia, un chercheur de la firme, vient de faire la démonstration de ses capacités. Le robot est doté d’une Intelligence artificielle qui lui permet de transformer une phrase qu’il ne connait pas en une suite d’événements physiques. Pour y parvenir, le robot va rechercher un maximum d’informations sur le Web, afin de savoir ce qu’il faut faire selon la phrase énoncée. Le robot peut donc saisir toutes les subtilités et complexités du langage selon Google.

Cela veut dire qu’il n’y a pas besoin d’enrichir le robot avec de nombreuses commandes vocales, comme c’est le cas avec les assistants virtuels comme Alexa, Siri ou l’assistant Google. Ainsi, le chercheur a montré que, lorsque l’on renversait un liquide, le robot réagissait en apportant une éponge alors qu’il ne l’avait jamais fait avant ni même appris à le faire.

Un puissant moteur linguistique
Pour comprendre et agir, le robot s’appuie sur le modèle de langage le plus puissant de chez Google. Il porte le nom de PaLM et absorbe de gigantesques quantités de textes provenant d’ouvrages ou du Web en utilisant le générateur de texte OpenAI GPT-3. C’est de cette façon qu’il peut enrichir ses compétences linguistiques et réagir correctement à une phrase. PaLM est également capable d’expliquer en langage naturel comment il parvient à une réponse précise face à une question.

Côté matériel, l’architecture du robot, c’est-à-dire une colonne roulante dotée d’un bras articulé avec une pince, provient d’Everyday Robots, une filiale de Google planchant sur un robot majordome.

Même si ce robot intégrant une version de PaLM boostée, est prometteur, il ne faut pas oublier que les IA, même performantes restituent ce qu’elles ingurgitent sur le Web. C’est ainsi que le chatbot de Meta s’est retrouvé à répondre de façon raciste avec des tendances complotistes après quelques semaines d’activité.

futura

You may like