Google vient de présenter sa nouvelle IA : Gemini. Ses particularités ? Elle est ultra-performante, comprend son environnement, les contextes, sait raisonner et même saisir les références culturelles… tout cela en temps réel. Une démo impressionnante a été partagée en vidéo.
La guerre de l’IA est lancée ! Alors que ChatGPT représente aujourd’hui la référence en la matière, Google a décidé de contre-attaquer avec Gemini. Il s’agit d’un « Large Language Model » (LLM), donc une IA capable de comprendre en temps réel ce qu’elle voit et de raisonner. A travers une vidéo bluffante, la firme de Mountain View nous montre ses capacités.
Gemini est une IA qui est capable de reconnaître en temps réel ce qu’elle voit.
Par exemple, la vidéo nous montre des mains qui dessinent un canard et immédiatement, l’IA sait ce qu’elle a devant les “yeux”, donnant des détails précis.
Ce n’est pas tout, puisqu’elle peut par exemple créer des jeux sur demande (ici reconnaitre les pays selon les emojis), de comprendre le contexte d’une image et même de saisir des références culturelles ! Par exemple, quand Gemini voit une vidéo d’un homme imiter Neo, elle sait de suite qu’il s’agit d’une référence à Matrix.
GEMINI, L’IA QUI VEUT BOUSCULER LE MARCHÉ
Gemini ne veut pas être une IA de plus sur le marché, mais une vraie révolution promise par Google. Sur un test MMLU, qui la compare aux capacités humaines, elle bât l’homme quasi-systématiquement. Google a également publié un benchmark dans lequel Gemini ridiculise ChatGPT.
Trois modèles de Gemini sont proposés.
Ultra, la plus avancée, Pro un peu en-dessous, et Nano, qui ne requiert pas de connexion et peut suffir pour des tâches simples. La firme de Mountain View n’a pas attendu pour diffuser son IA, puisqu’elle est d’ores et déjà intégrée dans Bard et le Pixel 8 Pro… mais pas encore en Europe, où elle doit passer à la moulinette du RGPD.
Dans son blog, Google explique avoir conçu Gemini comme un outil capable de nous aider dans la vie de tous les jours, de s’adapter à nos besoins et de se rendre utile à tous, tout le temps, dans n’importe quelle situation.
Un outil si performant, capable de raisonner par lui-même et de comprendre ce qu’il voit, pourrait s’avérer d’une efficacité redoutable et même signer une révolution. Comme d’habitude avec une nouvelle technologie si impressionnante, le doute, voire l’inquiétude, peut régner.
Il faudra du temps pour apprendre à maîtriser cet outil, comprendre ses limites, ses qualités et les dérives qu’il peut engendrer.
Bard