‘ChatGPT peut désormais voir, entendre et parler’

La révolution de l’intelligence artificielle franchit un nouveau cap avec la dernière annonce de la start-up OpenAI. Lundi, l’entreprise a dévoilé une mise à jour de son célèbre programme d’IA, ChatGPT, en y ajoutant des facultés de parole et de vision. Cette avancée spectaculaire promet de rendre l’IA plus intuitive que jamais.

ChatGPT, qui a déjà fait ses preuves en générant du texte, des images et d’autres contenus sur simple demande, va désormais être en mesure de répondre aux requêtes contenant des images et même d’engager des conversations vocales avec ses utilisateurs.

« ChatGPT peut désormais voir, entendre et parler (…) les utilisateurs de Plus pourront avoir des conversations vocales avec ChatGPT (iOS et Android) et inclure des images dans les conversations (toutes les plateformes) », a annoncé l’entreprise sur Twitter/X.

 

Les utilisateurs pourront par exemple prendre une photo d’un monument et engager une conversation avec ChatGPT pour en apprendre davantage sur l’histoire de l’édifice. De plus, il sera possible de montrer au logiciel le contenu de son réfrigérateur, et celui-ci pourra alors proposer des recettes appropriées. Ces capacités ouvrent la porte à de nombreuses applications, notamment l’aide aux devoirs des enfants (par exemple, en prenant une photo d’un problème mathématique) ou la narration d’histoires avant le coucher.

Ces nouvelles fonctionnalités seront disponibles dans les deux prochaines semaines pour les abonnés de ChatGPT Plus, la version payante du chatbot, ainsi que pour les clients de la version Enterprise. OpenAI avait déjà annoncé l’ajout de telles capacités en mars dernier lors de la présentation de GPT-4, la dernière version de son modèle de langage. GPT-4 est un modèle multimédia, capable de traiter des données autres que du texte ou du code informatique.

Cette avancée propulse l’intelligence artificielle vers de nouveaux horizons, ouvrant la voie à une interaction homme-machine plus fluide et plus enrichissante que jamais. Les possibilités semblent infinies, et il est passionnant de voir comment ChatGPT va transformer notre manière d’interagir avec la technologie.

Les utilisateurs pourront par exemple prendre une photo d’un monument et engager une conversation avec ChatGPT pour en apprendre davantage sur l’histoire de l’édifice. De plus, il sera possible de montrer au logiciel le contenu de son réfrigérateur, et celui-ci pourra alors proposer des recettes appropriées. Ces capacités ouvrent la porte à de nombreuses applications, notamment l’aide aux devoirs des enfants (par exemple, en prenant une photo d’un problème mathématique) ou la narration d’histoires avant le coucher.

Ces nouvelles fonctionnalités seront disponibles dans les deux prochaines semaines pour les abonnés de ChatGPT Plus, la version payante du chatbot, ainsi que pour les clients de la version Enterprise. OpenAI avait déjà annoncé l’ajout de telles capacités en mars dernier lors de la présentation de GPT-4, la dernière version de son modèle de langage. GPT-4 est un modèle multimédia, capable de traiter des données autres que du texte ou du code informatique.

Cette avancée propulse l’intelligence artificielle vers de nouveaux horizons, ouvrant la voie à une interaction homme-machine plus fluide et plus enrichissante que jamais. Les possibilités semblent infinies, et il est passionnant de voir comment ChatGPT va transformer notre manière d’interagir avec la technologie.

Les utilisateurs pourront par exemple prendre une photo d’un monument et engager une conversation avec ChatGPT pour en apprendre davantage sur l’histoire de l’édifice. De plus, il sera possible de montrer au logiciel le contenu de son réfrigérateur, et celui-ci pourra alors proposer des recettes appropriées. Ces capacités ouvrent la porte à de nombreuses applications, notamment l’aide aux devoirs des enfants (par exemple, en prenant une photo d’un problème mathématique) ou la narration d’histoires avant le coucher.

Ces nouvelles fonctionnalités seront disponibles dans les deux prochaines semaines pour les abonnés de ChatGPT Plus, la version payante du chatbot, ainsi que pour les clients de la version Enterprise. OpenAI avait déjà annoncé l’ajout de telles capacités en mars dernier lors de la présentation de GPT-4, la dernière version de son modèle de langage. GPT-4 est un modèle multimédia, capable de traiter des données autres que du texte ou du code informatique.

Cette avancée propulse l’intelligence artificielle vers de nouveaux horizons, ouvrant la voie à une interaction homme-machine plus fluide et plus enrichissante que jamais. Les possibilités semblent infinies, et il est passionnant de voir comment ChatGPT va transformer notre manière d’interagir avec la technologie.

pulse

You may like