À la fin d’I/O, la conférence annuelle des développeurs de Google au Shoreline Amphitheatre à Mountain View, le PDG de Google, Sundar Pichai, a révélé que la société avait dit « IA » 121 fois. C’était essentiellement l’essentiel du discours d’ouverture de deux heures de Google : intégrer l’IA dans toutes les applications et services de Google utilisés par plus de deux milliards de personnes dans le monde. Voici toutes les mises à jour majeures annoncées par Google lors de l’événement.
Mises à jour Gemini 1.5 Flash et Gemini 1.5 Pro
Google a annoncé un tout nouveau modèle d’IA appelé Gemini 1.5 Flash, qui, selon lui, est optimisé pour la vitesse et l’efficacité. Le Flash se situe entre le Gemini 1.5 Pro et le Gemini 1.5 Nano, le plus petit modèle de la société qui fonctionne nativement sur l’appareil. Google a déclaré avoir créé Flash parce que les développeurs voulaient un modèle plus léger et moins coûteux que Gemini Pro pour créer des applications et des services basés sur l’IA tout en conservant certains éléments comme une fenêtre contextuelle d’un million de caractères qui distingue Gemini Pro des modèles concurrents. Plus tard cette année, Google doublera la fenêtre contextuelle Gemini pour la porter à 2 millions de jetons, ce qui signifie qu’il sera capable de traiter 2 heures de vidéo, 22 heures d’audio et plus de 60 000 lignes de code ou plus de 1,4 million de mots dans le même souffle. . le temps. .
Projet Astra
Google a présenté le projet Astra, une première version d’un assistant mondial alimenté par l’IA, qui, selon Demis Hassabis, PDG de DeepMind de Google, est la version de Google d’un agent d’IA « qui pourrait être utile dans la vie de tous les jours ».
Dans une vidéo qui, selon Google, a été filmée en une seule prise, un utilisateur d’Astra se déplace dans le bureau de Google à Londres en tenant son téléphone et en pointant la caméra vers différentes choses – un haut-parleur, du code sur un tableau blanc, à l’extérieur d’une fenêtre – et a une conversation naturelle. avec l’application pour savoir à quoi elle ressemble. Et dans l’un des moments les plus impressionnants de la vidéo, elle indique correctement à l’utilisateur où elle a laissé ses lunettes auparavant sans que l’utilisateur ne lève jamais ses lunettes.
La vidéo se termine par une surprise : lorsque l’utilisateur trouve les lunettes manquantes et les met, nous apprenons qu’elles disposent d’un système de caméra intégré et qu’elles peuvent utiliser le projet Astra pour avoir une conversation transparente avec l’utilisateur, ce qui pourrait suggérer que Google travaille peut-être sur un concurrent des lunettes intelligentes Ray Ban de Meta.
Demandez à Google Images
Google Photos était déjà intelligent lorsqu’il s’agissait de rechercher des photos ou des vidéos spécifiques, mais avec l’IA, Google passe au niveau supérieur. Si vous êtes abonné à Google One aux États-Unis, vous pourrez poser à Google Photos une question complexe telle que « Montrez-moi la meilleure photo de chaque parc national que vous avez visité » lorsque la fonctionnalité sera déployée au cours des prochaines années. mois. Google Photos utilisera vos informations GPS ainsi que son propre jugement sur ce qui est « le mieux » pour vous proposer des options. Vous pouvez également demander à Google Photos de générer des légendes pour publier des photos sur les réseaux sociaux.
Voir et imaginer 3
Les nouveaux moteurs de création multimédia de Google basés sur l’IA s’appellent Veo et Imagine 3. Veo est la réponse de Google à Sora d’OpenAI. Google a déclaré qu’il pouvait produire des vidéos 1080p de « haute qualité » pouvant durer « plus d’une minute » et comprendre des concepts cinématographiques tels que le time-lapse.
Pendant ce temps, Imagen 3 est un générateur de texte en image qui, selon Google, gère mieux le texte que son prédécesseur, Imagen 2. Le résultat est le modèle texte en image de la plus haute qualité de l’entreprise avec un « niveau de détail incroyable » pour un résultat « réaliste ». , des images réalistes. » » et moins d’artefacts – ce qui l’oppose essentiellement au DALLE-3 d’OpenAI.
Grosses mises à jour de la recherche Google
Google apporte de grands changements au fonctionnement fondamental de la recherche. La plupart des mises à jour annoncées aujourd’hui ressemblent à la possibilité de poser des questions très complexes (« Trouvez les meilleurs studios de yoga ou de Pilates à Boston et affichez les détails des offres et les temps de marche depuis Beacon Hill. ») et d’utiliser la recherche pour planifier les repas et les vacances. Il ne sera disponible que si vous vous inscrivez à Search Labs, la plate-forme de l’entreprise qui permet aux utilisateurs d’essayer les fonctionnalités bêta.
Mais la grande nouveauté, que Google appelle AI Overviews et que l’entreprise teste depuis un an maintenant, est enfin en train d’être déployée auprès de millions de personnes aux États-Unis. La recherche Google présentera désormais par défaut les réponses générées par l’IA en haut des résultats, et la société affirme qu’elle mettra cette fonctionnalité à la disposition de plus d’un milliard d’utilisateurs dans le monde d’ici la fin de l’année.
Gémeaux sur Android
Google intègre Gemini directement dans Android. Lorsque Android 15 sortira plus tard cette année, Gemini saura quelle application, photo ou vidéo vous lisez, et pourra la faire glisser en superposition et lui poser des questions spécifiques au contexte. Où cela laisse-t-il Google Assistant qui fait déjà cela ? Qui connaissez-vous! Google n’en a pas du tout évoqué lors du discours d’aujourd’hui.
Il y a également eu de nombreuses autres mises à jour. Google a annoncé qu’il ajouterait des filigranes numériques aux vidéos et textes générés par l’IA, rendrait Gemini accessible dans le panneau latéral de Gmail et Docs, prendrait en charge un collègue virtuel alimenté par l’IA dans Workspace, écouterait les appels téléphoniques et détecterait si vous êtes réellement victime d’une arnaque. du temps, et bien plus encore.
Suivez toute l’actualité de Google I/O 2024 en direct ici!
« Amateur de musique. Joueur. Alcooliste. Lecteur professionnel. Spécialiste du Web. »