Wyatt Grantham Phillips, Associated Press
Publié le mardi 21 mai 2024 à 15h42 HNE
Dernière mise à jour le mardi 21 mai 2024 à 18h06 HNE
NEW YORK (AP) — OpenAI a annoncé lundi son intention de cesser d’utiliser l’une des voix ChatGPT qui, selon l’actrice Scarlett Johansson, semble « étrangement similaire » à la sienne.
Dans un article sur la plateforme de médias sociaux La société a déclaré avoir « entendu des questions » sur la manière dont les options vocales dynamiques disponibles pour son principal chatbot intelligent, en particulier Sky, avaient été sélectionnées, et souhaitait y répondre.
Parmi ceux qui soulevaient des questions figurait Johansson, surtout connu pour avoir exprimé l’assistant d’intelligence artificielle fictif et à l’époque futuriste dans le film « Her » de 2013.
Johansson a publié une déclaration disant que le PDG d’OpenAI, Sam Altman, l’avait appelée en septembre et lui avait demandé si elle prêterait sa voix au système, affirmant qu’il pensait que ce serait « réconfortant pour les personnes » qui ne se sentaient pas à l’aise avec la technologie. Elle a rejeté l’offre.
« Quand j’ai entendu la démo sortir, j’ai été choqué, en colère et incrédule que M. Altman ait une voix qui ressemblait si étrangement à la mienne que même mes amis les plus proches et les médias ne pouvaient pas faire la différence », a déclaré Johansson. .
Elle a déclaré qu’OpenAI avait accepté « à contrecœur » de supprimer l’audio de Sky après avoir embauché des avocats qui ont écrit des lettres à Altman pour lui demander quel était le processus par lequel la société avait créé l’audio.
OpenAI avait décidé de démystifier les théories Internet sur Johansson dans un article de blog accompagnant son annonce précédente qui prétendait détailler comment les votes ChatGPT étaient sélectionnés. La société a écrit qu’elle pensait que les voix de l’IA « ne devraient pas intentionnellement imiter la voix distincte d’une célébrité » et que la voix de Skye appartenait à une « actrice professionnelle différente ». Mais elle a ajouté qu’elle ne pouvait pas partager le nom de cette actrice pour des raisons de confidentialité.
Dans une déclaration envoyée à l’Associated Press après la réponse de Johansson lundi soir, Altman a déclaré qu’OpenAI avait sélectionné le doubleur derrière Sky « avant toute communication » avec Johansson.
« La voix de Skye n’est pas la voix de Scarlett Johansson, et elle n’était pas du tout destinée à ressembler à sa voix. Par respect pour Mme Johansson, nous avons cessé d’utiliser la voix de Skye dans nos produits. Nous sommes désolés auprès de Mme Johansson de ne pas avoir pu mieux communiqué avec elle », a déclaré Altman.
OpenAI, basé à San Francisco, a déployé pour la première fois les capacités vocales de ChatGPT, qui comprenaient cinq voix différentes, en septembre, permettant aux utilisateurs d’engager une conversation en direct avec un assistant IA. Le mode vocal n’était à l’origine disponible que pour les abonnés payants, mais en novembre, OpenAI a annoncé que la fonctionnalité deviendrait gratuite pour tous les utilisateurs d’applications mobiles.
Les interactions ChatGPT deviennent de plus en plus complexes. La semaine dernière, OpenAI a déclaré qu’une récente mise à jour de son modèle d’IA générative pouvait imiter les rythmes humains dans ses réponses verbales et pouvait même essayer de détecter l’humeur des gens.
OpenAI affirme que le modèle le plus récent, appelé GPT-4o, fonctionne plus rapidement que les versions précédentes et peut raisonner via du texte, de l’audio et de la vidéo en temps réel. Dans une démo lors de l’annonce d’OpenAI le 13 mai, le robot IA a parlé en temps réel, ajoutant de l’émotion – en particulier « plus de drame » – à sa voix à la demande. J’ai également essayé d’extrapoler l’état émotionnel d’une personne en regardant une vidéo selfie de son visage, à l’aide de traductions linguistiques, de problèmes mathématiques étape par étape, et bien plus encore.
GPT-4o, abréviation de « omni », n’est pas encore largement disponible. Il sera progressivement diffusé auprès d’utilisateurs sélectionnés dans les semaines et les mois à venir. Les capacités de texte et d’image du formulaire commencent déjà à être déployées et devraient même atteindre certains de ceux qui utilisent le niveau gratuit de ChatGPT – mais le nouveau mode vocal ne sera disponible que pour les abonnés payants de ChatGPT Plus.
Bien que la plupart n’aient pas encore mis la main sur ces fonctionnalités nouvellement annoncées, ces capacités ont en outre évoqué des comparaisons avec le roman d’amour dystopique de Spike Jonze, Her, qui tourne autour d’un homme introverti (Joaquin Phoenix) qui tombe amoureux d’un patron de l’IA. Johansson, ce qui entraîne de nombreuses complications.
Altman semble en avoir également profité, puisqu’il l’a simplement publié sur la plateforme de médias sociaux X le jour du dévoilement de GPT-4o.
De nombreuses personnes ayant interagi avec les démos du mannequin la semaine dernière ont également trouvé que certaines interactions avaient un ton étrangement coquet. Dans une vidéo publiée par OpenAI, un ChatGPT d’une voix féminine complimente un employé de l’entreprise pour « porter une veste OpenAI », par exemple, et dans une autre, le Chatbot dit « Oh, arrête ça, tu me fais rougir » après qu’on lui ait dit que c’est incroyable.
Cela a déclenché un débat sur les méthodes utilisées depuis longtemps par les entreprises technologiques pour développer et utiliser des assistants vocaux, qui, selon les critiques, remontent bien avant la récente vague de capacités de chatbot développées par l’IA générative. En 2019, l’Organisation des Nations Unies pour la culture et la science a souligné la « soumission programmée » intégrée aux assistants vocaux virtuels féminins (comme Siri d’Apple à Alexa d’Amazon), même lorsqu’elles sont confrontées à des insultes et à du harcèlement sexuels.
La semaine dernière, Desi Ledec, correspondant du « Daily Show », a déclaré à propos du GPT-4o : « Cet appareil a été clairement programmé pour satisfaire les egos masculins. Vous pouvez dire qu’un homme a construit cette technologie. »
——
Associated Press et OpenAI ont un accord de licence et de technologie qui permet à OpenAI d’accéder à une partie des archives textuelles de l’AP.
jQuery(document).ready( function(){ window.fbAsyncInit = function() { FB.init({ appId : '117341078420651', // App ID channelUrl : 'https://static.ctvnews.ca/bellmedia/common/channel.html', // Channel File status : true, // check login status cookie : true, // enable cookies to allow the server to access the session xfbml : true // parse XFBML }); FB.Event.subscribe("edge.create", function (response) { Tracking.trackSocial('facebook_like_btn_click'); });
// BEGIN: Facebook clicks on unlike button FB.Event.subscribe("edge.remove", function (response) { Tracking.trackSocial('facebook_unlike_btn_click'); }); };
var plusoneOmnitureTrack = function () { $(function () { Tracking.trackSocial('google_plus_one_btn'); }) } var facebookCallback = null; requiresDependency('https://connect.facebook.net/en_US/all.js#xfbml=1&appId=117341078420651', facebookCallback, 'facebook-jssdk'); });
jQuery(document).ready( function(){ window.fbAsyncInit = function() { FB.init({ appId : '117341078420651', // App ID channelUrl : 'https://static.ctvnews.ca/bellmedia/common/channel.html', // Channel File status : true, // check login status cookie : true, // enable cookies to allow the server to access the session xfbml : true // parse XFBML }); FB.Event.subscribe("edge.create", function (response) { Tracking.trackSocial('facebook_like_btn_click'); });
// BEGIN: Facebook clicks on unlike button FB.Event.subscribe("edge.remove", function (response) { Tracking.trackSocial('facebook_unlike_btn_click'); }); };
var plusoneOmnitureTrack = function () { $(function () { Tracking.trackSocial('google_plus_one_btn'); }) } var facebookCallback = null; requiresDependency('https://connect.facebook.net/en_US/all.js#xfbml=1&appId=117341078420651', facebookCallback, 'facebook-jssdk'); });