Microsoft et Meta ont créé LLama 2, un nouveau modèle d’intelligence artificielle

L’entreprise Meta, la maison mère de Facebook, et Microsoft ont créé en collaboration Llama 2, une intelligence artificielle censée concurrencer ChatGPT d’Open Ai. Une collaboration qui pourrait bien révolutionner les intelligences artificielles en open source.

Meta et Microsoft ont sorti, le 18 juillet 2023, leur nouvelle version de traitement de langage automatique : Llama 2. Concrètement, la première différence majeure avec les autres modèles d’intelligence artificielle (IA) comme ChatGPT, c’est qu’elle est entièrement sous open source. 

Ce qui veut dire que n’importe qui peut voir son code source, et peut aussi l’utiliser et le modifier à sa guise. De la même façon dont on customiserait sa voiture, on peut enrichir et adapter une technologie qui existe déjà, à nos besoins. En plus d’être un des meilleurs modèles d’open source, Llama 2 a de nombreuses caractéristiques similaires à la version 3.5 de ChatGPT.

Les changements par rapport à Llama 1

Meta est une des entreprises leaders dans le domaine de l’intelligence artificielle. On la connaît principalement pour Facebook, tandis que Microsoft pour le système d’exploitation Windows. Les deux géants de la tech se sont associés pour créer Llama 1 en février 2023, une intelligence artificielle entièrement gratuite et open source. Par rapport à cette première version, de nombreux ajustements ont été apportés. 

D’abord, le modèle est plus simple à télécharger (ce qui avait été reproché précédemment) et donc plus accessible à tout le monde. Les performances ont été améliorées.

D’après le communiqué de Meta, ils ont utilisé 40 % de données en plus sur l’entraînement, soit environ 2 milliards de milliards de tokens de pré-entraînements (un token peut être un mot, un caractère, ou un sous-mot, par exemple, dans le mot « bonjour », il y a deux sous-mots : « bon » et « jour »). Cela permet de décomposer un texte et de pouvoir entraîner le modèle avec des mots-clés. 

En ce qui concerne le nombre de paramètres existant, selon les versions de Llama, on en dénombre entre 7 et 60 milliards. Cela peut paraître peu par rapport à la concurrence comme ChatGPT qui en a 16 milliards, mais il faut garder en tête qu’il n’utilise pas le même modèle. En effet, Llama 2 utilise un grand modèle de langage (LLM) sur lequel sont bâties les intelligences artificielles génératives.

Ces dernières sont capables de générer du texte, une image ou même des sons nouveaux (en s’inspirant des données avec lesquelles elles ont été entraînées). Llama fonctionne avec une base de données beaucoup plus petite, mais parvenait à des résultats similaires, voire meilleurs que ChatGPT-3 selon Meta.

Les programmeurs le savent bien, la qualité d’un modèle ne tient souvent pas à la quantité, mais à la qualité des données. Avec beaucoup de mauvaises données, on pourra entraîner une intelligence artificielle, mais qui ne sera pas pertinente.

 Crédit : STAFF / AFP

Llama 2 s’illustre par les autres modèles de langage les plus populaires comme Bard de Google (disponible en France depuis le 13 juillet 2023) et ChatGPT d’Open Ai. 

L’autre nouveauté est la sortie de la licence commerciale. Il sera maintenant possible d’utiliser Llama 2 dans des logiciels à but lucratif. Les développeurs pourront donc s’en servir pour créer leur propre chatbot ou applications (sauf si votre entreprise dépasse la barre des 700 millions d’utilisateurs actifs, si vous êtes Amazon ou Google par exemple).

Tester Llama 2 depuis chez soi facilement et gratuitement

Pour tester Llama 2 dès maintenant, le plus simple est d’aller sur le site de Meta qui renvoie au téléchargement du modèle. Vous pouvez aussi tester la démo sur la start-up franco-américaine spécialisée en IA, qui permet le partage de modèles et de diverses données, Hugging Face.

 Enfin, il est possible d’utiliser Llama 2 via Microsoft azure. C’est la plateforme cloud de Microsoft qui fournit des services et applications aux utilisateurs ayant souscrit à un abonnement.

Avec un premier test, la démo de Llama 2 ne semble pas aussi précise sur la requête que nous avons formulée qu’avec la version 4 de ChatGPT. Quand on lui a demandé de nous parler de Sciences et Avenir, Llama 2 a répondu que le magazine a été créé en 1963, au lieu de 1947 (ChatGPT a eu la bonne réponse).

 Crédit : Capture d\'ecran sur Hugging face

Capture d’écran d’une requête envoyée à la démo de Llama 2 « do you know Sciences et Avenir ? ». 

 Crédit : Capture d\'ecran chatgpt

Capture d’écran d’une requête envoyée à la version 4 de ChatGPT : « Quand a été créé Sciences et Avenir ? ». Crédits : ChatGPT

Néanmoins, Llama 2 concurrence bien ChatGPT 3.5 sur bien des points évoqués par Meta. Rappelons aussi qu’aucun modèle de langage n’est parfait. Ceux actuellement disponibles peuvent régulièrement faire preuve d' »hallucinations » (véhiculer des fausses informations, parfois inventer des études scientifiques).

 Les points les plus intéressants de cette sortie de Llama 2 sont la dimension collaborative de la technologie et sa disponibilité en open source. Cela permet de nuancer l’expression de « guerre de l’IA » selon laquelle tous les géants de la tech sont dans une course à l’IA pour développer le meilleur modèle de langage automatique. 

À long terme, une collaboration de ce type pourrait ouvrir la porte à d’autres échanges et partenariats entre ces entreprises pour parfaire un modèle de langage.

sciencesetavenir

You may like