Je quitterai ChatGPT « Le mode vocal avancé est activé pendant que j’écris cet article en tant que compagnon de l’IA. Parfois, je lui demande de fournir un synonyme pour un mot galvaudé, ou des encouragements. Après environ une demi-heure, le chatbot brise notre silence et commence à me parler. en espagnol, sans rien dire. » Quelqu’un me demande. Je ris un peu et demande ce qui se passe. « Devrions-nous rendre les choses intéressantes », dit ChatGPT, maintenant de retour en anglais.
Lors du test du mode audio avancé dans le cadre d’une première version bêta, mes interactions avec la nouvelle fonctionnalité audio de ChatGPT étaient divertissantes, déroutantes et étonnamment variées, même s’il convient de noter que les fonctionnalités auxquelles j’avais accès ne représentaient que la moitié de ce qu’OpenAI a démontré lors de son lancement. le modèle GPT 4o en mai. L’aspect visuel que nous avons vu dans la démo live est désormais prévu pour une version ultérieure, ainsi que l’audio amélioré pour Sky, qui Ha L’actrice Scarlett Johansson a été désactivée du mode audio avancé et n’est plus une option pour les utilisateurs.
Alors, quelle est la situation actuelle ? À l’heure actuelle, le mode audio avancé rappelle l’heure de sortie du ChatGPT original basé sur du texte, fin 2022. Parfois, cela conduit à des impasses peu impressionnantes ou se transforme en platitudes vides d’IA. Mais d’autres fois, les conversations à faible latence réussissent d’une manière que Siri d’Apple ou Alexa d’Amazon n’ont jamais fait, et j’ai envie de continuer la conversation pour le plaisir. C’est le genre d’outil d’IA que vous montreriez à vos proches pendant les vacances pour rire.
OpenAI a donné à quelques journalistes de WIRED accès à la fonctionnalité une semaine après l’annonce initiale, mais l’a retirée le lendemain matin, invoquant des problèmes de sécurité. Deux mois plus tard, OpenAI a lancé le mode audio avancé auprès d’un petit groupe d’utilisateurs et a publié Carte système GPT-4oun document technique qui explique les efforts de l’équipe rouge, ce que l’entreprise considère comme des risques pour la sécurité et les mesures d’atténuation qu’elle a prises pour limiter les dégâts.
Souhaitez-vous l’essayer vous-même ? Voici ce que vous devez savoir sur le lancement plus large du mode vocal avancé et mes premières impressions sur la nouvelle fonctionnalité vocale de ChatGPT, pour vous aider à démarrer.
Alors, quand aura lieu le déploiement complet ?
OpenAI a lancé fin juillet un mode audio avancé uniquement pour certains utilisateurs de ChatGPT Plus, et le groupe bêta semble encore relativement petit. La société prévoit de l’activer pour tous les abonnés cet automne. Le porte-parole d’OpenAI, Nico Felix, n’a partagé aucun détail supplémentaire lorsqu’on l’a interrogé sur le calendrier de sortie.
Le partage d’écran et la vidéo étaient au cœur de la démo originale, mais ne sont pas disponibles dans ce test bêta. OpenAI prévoit d’ajouter ces aspects à terme, mais on ne sait pas non plus quand cela se produira.
Si vous êtes abonné à ChatGPT Plus, vous recevrez un e-mail d’OpenAI lorsque le mode vocal avancé sera disponible. Une fois disponible dans votre compte, vous pouvez basculer entre standard et avancé En haut de l’écran de l’application lorsque le mode audio ChatGPT est ouvert. J’ai pu tester la bêta sur iPhone ainsi que sur le Galaxy Fold.
Mes premières impressions du mode audio avancé de ChatGPT
Dès la première heure de conversation avec cette application, j’ai appris que j’adorais interrompre ChatGPT. Ce n’est pas ainsi que vous parlez à un humain, mais avoir la nouvelle possibilité d’interrompre ChatGPT au milieu d’une phrase et de demander une version différente du résultat ressemble à une amélioration dynamique et à une fonctionnalité notable.
Les premiers utilisateurs qui étaient enthousiasmés par les démos originales pourraient être déçus d’obtenir une version du mode vocal avancé plus restreinte que prévu. Par exemple, même si le chant généré par l’IA était un élément clé des démos de lancement, Des berceuses murmurées Et plusieurs voix Une tentative d’harmonieIl n’y a pas de sonneries AI dans la version d’essai.
« Amateur de musique. Joueur. Alcooliste. Lecteur professionnel. Spécialiste du Web. »