Project Mariner et mode vocal avancé

Jon AI Logiciel de Facturation par IA Gratuit IA
par Stélio Inácio, fondateur de Jon AI et spécialiste de l'IA

Les mains et la voix de l'IA : Project Mariner et mode vocal avancé

Au cours de notre parcours, nous avons vu comment l'IA peut traiter de vastes informations et générer de nouvelles idées. Nous assistons aujourd'hui au prochain grand pas en avant : l'IA gagne des « mains » sophistiquées pour agir en notre nom et une « voix » presque identique à la nôtre. Il ne s'agit pas de rendre l'IA plus humaine pour des raisons de nouveauté ; il s'agit de changer fondamentalement notre relation avec la technologie, pour en faire un partenaire de conversation fluide.

Nous explorerons deux technologies pionnières à la pointe de cette tendance. Tout d'abord, Project Mariner, un agent d'intelligence artificielle qui agit comme votre navigateur personnel sur la vaste mer d'Internet et qui exécute des tâches complexes pour vous. Ensuite, le mode vocal avancé, qui transforme les commandes vocales robotiques maladroites du passé en conversations fluides et émotionnellement intelligentes. Ensemble, ils représentent un avenir dans lequel vous énoncez simplement ce dont vous avez besoin, et où votre IA peut à la fois vous comprendre avec nuance et exécuter la tâche dans le monde numérique.

Pleins feux sur le concept : Project Mariner, l'agent de l'IA

Imaginez que vous deviez trouver un nouvel appartement. L'ancienne méthode impliquait de passer des heures à parcourir plusieurs sites Web, à comparer des listes, à vérifier des cartes et à remplir des formulaires. La nouvelle méthode consiste à dire à un agent d'intelligence artificielle : « Trouvez-moi un appartement de deux chambres près de mon bureau, à moins de 2 000 dollars, qui accepte les animaux de compagnie, et créez une feuille de calcul contenant les cinq meilleures options. »

C'est le travail de Project Mariner. Il s'agit d'un « agent d'intelligence artificielle » installé dans votre navigateur Web. Vous lui fixez un objectif complexe et il navigue de manière autonome sur les sites Web (lecture de texte, compréhension d'images, clic sur des boutons et remplissage de formulaires) pour y parvenir. Il ne s'agit pas simplement de suivre un script ; il s'agit d'utiliser l'intelligence d'un modèle tel que Gemini pour résoudre des problèmes sur le Web. C'est comme engager un assistant infatigable et ultrarapide pour gérer vos tâches en ligne, qu'il s'agisse de planifier des vacances à étapes multiples ou de trouver le meilleur prix pour un nouvel ordinateur portable.

Attention : Supervisez toujours votre agent

Une IA capable d'agir en votre nom est incroyablement puissante, mais elle nécessite une supervision. Les technologies telles que Project Mariner sont conçues dans un souci de sécurité, empêchant ainsi l'IA de faire des achats sans votre approbation finale. Cependant, vous devez toujours revoir les mesures qu'il prévoit de prendre et surveiller son travail pour vous assurer qu'il fait exactement ce que vous vouliez.

Mode vocal avancé : des commandes à la conversation

Alors que Project Mariner donne des « mains » à l'IA, le mode vocal avancé lui donne une « voix » naturelle et réactive. Pendant des années, parler à une IA impliquait de formuler des commandes claires et simples et d'attendre une réponse robotique. C'était une rue à sens unique.

Le mode vocal avancé, alimenté par des modèles tels que le GPT-4o d'OpenAI, change complètement la donne. Il utilise un modèle unique et unifié qui traite le ton de votre voix, votre rythme et même l'émotion contenue dans vos mots, le tout en temps réel. Vous pouvez l'interrompre, il peut détecter le sarcasme, il peut rire avec vous et il peut réagir avec une variété de tons et d'émotions qui lui sont propres. Le décalage a disparu. La conversation se poursuit. C'est l'expérience la plus proche que nous ayons jamais eue de l'IA dans le film Her, en faisant en sorte que l'interaction ressemble moins à celle de faire fonctionner une machine qu'à parler à une entité consciente.

Ressources : Voir et entendre le futur

Lire ces concepts est une chose, les voir et les entendre en est une autre.

Contrôle rapide

Lequel des énoncés suivants décrit le mieux les fonctions principales de Project Mariner et du mode vocal avancé ?

```

Récapitulatif : Les mains et la voix de l'IA

Ce que nous avons abordé :
  • Project Mariner : un agent d'intelligence artificielle qui agit comme vos « mains » en ligne, naviguant de manière autonome sur les sites Web pour effectuer des tâches complexes à votre place.
  • Mode vocal avancé : une avancée technologique qui fournit à l'IA une « voix » conversationnelle naturelle, en temps réel et sensible aux émotions.
  • L'importance de superviser les agents de l'IA lorsqu'ils commencent à effectuer des actions en notre nom.

Pourquoi c'est important :
  • Ces technologies indiquent le passage d'une simple « utilisation » de l'IA à une « collaboration » avec elle. Ils constituent des étapes fondamentales vers un avenir où l'IA sera un véritable partenaire, parfaitement intégrée à notre vie quotidienne.

Prochaine étape :
  • Comment sera livrée cette nouvelle interface ? Nous explorerons l'avenir de notre principal portail d'accès au monde numérique : les lunettes dotées d'une intelligence artificielle.