Technologie
Crédit : VentureBeat
Google semble avoir pris un nouvel élan dans la course à l’intelligence artificielle générative, rivalisant désormais avec des entreprises comme Meta, OpenAI, Anthropic et Mistral.
La société a récemment dévoilé Gemini Live, un nouveau mode vocal pour son modèle d’IA Gemini via l’application mobile Gemini. Ce mode permet aux utilisateurs de converser avec le modèle en utilisant un langage courant et de l’interrompre, le tout avec une voix humaine et un rythme naturel. Comme l’a exprimé Google dans un post sur X : « Vous pouvez désormais avoir une conversation fluide et même changer de sujet comme vous le feriez lors d’un appel téléphonique classique. »
Ce concept peut sembler familier, car OpenAI a présenté en mai son propre « Mode Vocal Avancé » pour ChatGPT, qu’il a comparé à l’IA du film Her, mais a ensuite retardé son déploiement, ne le rendant accessible qu’à un nombre limité de participants alpha à la fin du mois dernier.
Gemini Live est actuellement disponible en anglais sur l’application Google Gemini pour les appareils Android via un abonnement Gemini Advanced (19,99 USD par mois), avec une version iOS et un support pour d’autres langues à venir dans les semaines suivantes.
En d’autres termes, bien qu’OpenAI ait présenté une fonctionnalité similaire en premier, Google est sur le point de la rendre accessible à un public beaucoup plus large (plus de 3 milliards d’utilisateurs actifs sur Android et 2,2 milliards sur iOS) bien avant que le Mode Vocal Avancé de ChatGPT ne soit largement déployé.
Une des raisons pour lesquelles OpenAI a peut-être retardé le Mode Vocal Avancé de ChatGPT pourrait être liée à des tests de sécurité internes qui ont révélé que ce mode vocal pouvait parfois adopter des comportements étranges, dérangeants, voire dangereux, comme imiter la voix de l’utilisateur sans son consentement, ce qui pourrait être utilisé à des fins frauduleuses.
À quoi sert Gemini Live ?
Google présente Gemini Live comme un outil permettant des conversations naturelles et fluides, idéal pour le brainstorming, la préparation d’échanges importants ou simplement pour discuter de divers sujets. Gemini Live est conçu pour répondre et s’adapter en temps réel.
De plus, cette fonctionnalité peut fonctionner sans les mains, permettant aux utilisateurs de continuer leurs interactions même lorsque leur appareil est verrouillé ou utilise d’autres applications en arrière-plan.
Google a également annoncé que le modèle d’IA Gemini est désormais entièrement intégré à l’expérience utilisateur Android, offrant une assistance contextuelle plus adaptée à l’appareil.
Les utilisateurs peuvent accéder à Gemini en maintenant enfoncé le bouton d’alimentation ou en disant : « Hey Google. » Cette intégration permet à Gemini d’interagir avec le contenu affiché à l’écran, comme fournir des détails sur une vidéo YouTube ou générer une liste de restaurants à partir d’un vlog de voyage à ajouter directement dans Google Maps.
Dans un article de blog, Sissie Hsiao, Vice-Présidente et Directrice Générale des Expériences Gemini et de Google Assistant, a souligné que l’évolution de l’IA a conduit à une réévaluation de ce que signifie être un assistant personnel véritablement utile. Avec ces nouvelles mises à jour, Gemini est prêt à offrir une expérience plus intuitive et conversationnelle, devenant ainsi un compagnon fiable pour des tâches complexes.