Sky, l’une des versions audios de ChatGPT présentée la semaine dernière, est suspendue après que Scarlett Johansson a tapé du poing sur la table. L’actrice américaine estime qu’OpenAI, l’entreprise à l’origine de ChatGPT, a volé sa voix, malgré son refus de la prêter à l’agent conversationnel. OpenAI se défend d’avoir cherché à imiter la voix de l’actrice américaine, mais a décidé de suspendre cet agent conversationnel vocal « par respect pour la comédienne ».
OpenAI a-t-il utilisé des enregistrements de la voix de Scarlett Johansson pour entraîner « Sky » ? La réponse est négative pour l’entreprise à l’origine de ChatGPT. Mais après le coup de gueule de l’actrice américaine, la société de Sam Altman a décidé de faire marche arrière et de suspendre Sky, l’une des versions vocales de ChatGPT dévoilée la semaine dernière. « Par respect pour Madame Johansson, nous avons cessé d’utiliser la voix de Sky dans nos produits.
Nous sommes désolés pour Madame Johansson de ne pas avoir mieux communiqué », a déclaré OpenAI à plusieurs médias américains dont NPR, après la polémique.
La semaine dernière, son chatbot vocal « Sky » avait été présenté en grande pompe, avec une voix très proche de l’actrice américaine, selon des utilisateurs. De quoi sidérer cette dernière, qui a fait parvenir un communiqué à NPR lundi 20 mai – un texte en partie publié sur X par Bobby Allyn, l’un de ses journalistes. L’actrice américaine accuse l’entreprise d’avoir volé sa voix, malgré son refus de prêter la sienne à ChatGPT.
OpenAI essayait de négocier depuis un an
Dans ce texte, la comédienne explique que depuis un an, OpenAI essayait, en vain, de négocier pour que sa voix, rendue célèbre avec le film « Her », soit celle de ChatGPT. On savait que Sam Altman, le PDG d’OpenAI, était fan de ce film dans lequel un homme tombe amoureux de son assistante virtuelle – assistante dont la voix est interprétée par Scarlett Johansson. C’est d’ailleurs ce mot, « Her », qu’il a publié peu après la présentation de Sky.
L’actrice explique : « Le PDG d’OpenAI pensait qu’en donnant ma voix au système, je pourrais combler le fossé entre les entreprises technologiques et les créateurs et aider les consommateurs à se sentir à l’aise avec le changement sismique concernant les humains et l’IA (…). Il pensait que ma voix serait réconfortante pour les gens ».
Mais pour l’actrice, c’est non. Y compris lorsque OpenAI est revenu à la charge, deux jours avant la toute première démonstration de Sky, rapporte la comédienne. « Deux jours avant la sortie de GPT-4o, Monsieur Altman a de nouveau contacté mon agent, demandant que je revienne sur ma décision. Avant que nous ayons pu reprendre contact, le système était sorti », relate-t-elle.
« Lorsque j’ai entendu la démo publiée, j’ai été choquée, en colère (…) »
La présentation a laissé l’actrice sans voix. « Lorsque j’ai entendu la démo publiée, j’ai été choquée, en colère et incrédule que Monsieur Altman poursuive une voix si étrangement similaire à la mienne que mes amis les plus proches et les médias n’ont pas pu faire la différence », rapporte-t-elle. De nombreux utilisateurs notent aussi cette ressemblance, alimentée par Sam Altman en personne. Peu après la présentation, le PDG d’OpenAI a publié sur X un simple « Her », en référence à son film préféré.
Les avocats de Scarlett Johansson ont alors demandé à OpenAI de détailler le processus de développement de la voix de ChatGPT.
Face à cette requête, OpenAI a finalement fait marche arrière. Dans son communiqué, l’actrice explique qu’OpenAI a accepté à contrecœur de retirer « Sky ». De son côté, l’entreprise a annoncé sur X qu’elle travaillait à suspendre l’utilisation de Sky, tout en œuvrant pour modifier cette voix.
La voix de Sky serait celle d’une actrice professionnelle différente
Une annonce complétée dans la foulée par un article de blog, dans lequel l’entreprise tente de se dédouaner en décrivant le processus de sélection des cinq voix qu’elle a finalement choisies pour ChatGPT, y compris celle de Sky. Elle précise que pour cette dernière, « les voix d’IA ne doivent pas imiter délibérément la voix caractéristique d’une célébrité. La voix de Sky n’est pas une imitation de Scarlett Johansson, mais celle d’une actrice professionnelle différente qui utilise sa propre voix naturelle.
(Mais) pour protéger leur vie privée, nous ne pouvons pas divulguer les noms de nos voix », a assuré l’ancienne start-up.
Preuve qu’OpenAI n’a pas volé la voix de Scarlett Johansson, l’actrice à l’origine de la voix de Sky aurait été recrutée avant que l’entreprise ne contacte la comédienne américaine. « La voix de Sky n’est pas celle de Scarlett Johansson et n’a jamais été destinée à lui ressembler », a insisté Sam Altman dans une déclaration communiquée à nos confrères.
Une mauvaise communication, selon Sam Altman
Mais « par respect pour Madame Johansson, nous avons cessé d’utiliser la voix de Sky dans nos produits », a-t-il ajouté, suggérant qu’il s’agissait surtout d’une mauvaise communication, d’un malentendu. Un argument battu en brèche par l’auteur de Platformer, qui écrit dans sa newsletter : « il n’y a jamais eu de malentendu sur ce qui se passait ici. Sam Altman a demandé une licence pour sa voix (…) ; Scarlett Johansson a refusé ; et la société a quand même procédé avec une voix aussi similaire à la sienne que possible ».
Pour l’actrice, ce cas, emblématique du conflit entre l’IA générative et les acteurs ou auteurs qui se sentent pillés par cette technologie, mérite « une clarté absolue », « à une époque où nous sommes tous aux prises avec les deepfakes ».
Cette dernière, qui a pour l’instant obtenu gain de cause, a appelé à l’adoption « d’une législation appropriée pour contribuer à garantir la protection des droits individuels ».
NPR