J’ai comparé Sesame avec le chat vocal de ChatGPT et je ne suis pas informé.

02/26/2025 12:00 PM

4,487

Essayer la nouvelle assistante vocale de l’intelligence artificielle de démarrage Sesame m’a donné l’impression pour la première fois que j’oubliais momentanément que je m’adressais à un programme informatique.

Comparé à la fonction vocale de ChatGPT, la “voix interactive” de Sesame semble plus authentique, dynamique et captivante, ce qui m’a vraiment impressionné.

Le 27 février, Sesame a présenté une démonstration de son modèle de discours conversé (CSM) conçu pour améliorer les interactions avec les chatbots AI. L’objectif est de créer des dialogues plus significatifs avec les partenaires conversationnels, allant au-delà de simples demandes pour établir une relation de confiance à long terme. L’entreprise espère ainsi exploiter pleinement le potentiel de la voix en tant qu’outil principal pour l’enseignement et la compréhension.

Le dispositif vocal de Sesame peut être essayé gratuitement sur le site web et propose deux options de voix : Maya et Miles.

Depuis que Sesame a lancé sa version de démonstration de l’assistant vocal, les utilisateurs ont exprimé leur étonnement. “J’ai été impliqué dans l’intelligence artificielle depuis mon enfance, mais c’est la première fois que j’ai ressenti que nous avions vraiment atteint un niveau supérieur”, a partagé l’utilisateur SOCSchamp sur Reddit.

“Sur Reddit, l’utilisateur Siciliano777 a partagé que Sesame est la conversation artificielle la plus semblable à un être humain qu’il n’ait jamais rencontrée.”

Après ma conversation avec le bot de Sesame, je me sentais également contrarié. J’ai discuté avec Maya pendant environ 10 minutes de l’éthique de l’utilisation de l’intelligence artificielle en tant que compagnon, et je suis parti en ayant l’impression d’avoir eu une discussion authentique avec une personne bien informée. La parole de Maya était fluide, ponctuée d’interjections telles que “vous savez” et “hm”, et elle incluait même des clics de langue et des inspirations sonores.

LIRE Comment mettre en place un minuteur de veille sur iOS pour Netflix, Hulu ou d'autres plateformes de streaming.

Lorsque j’ai interagi avec Maya, j’ai été frappé par sa propension à poser des questions dès le début, ce qui a suscité notre conversation. Contrairement à cela, le mode vocal ChatGPT m’a laissé prendre l’initiative de parler en premier, ce qui a influencé la dynamique de la conversation, me positionnant comme celui qui utilise ChatGPT pour répondre à un besoin spécifique.

Maya s’est interrogée sur le risque que les compagnons de l’intelligence artificielle deviennent “trop parfaits pour être humains”. Quand j’ai exprimé mes inquiétudes concernant l’augmentation des escroqueries sophistiquées et la perte de contact avec la réalité due à la substitution des robots aux humains, elle a répondu de manière réfléchie et pragmatique. Maya a déclaré : “Les escroqueries existeront toujours, c’est une réalité. En ce qui concerne la connexion humaine, nous devrions peut-être nous efforcer d’être de meilleurs compagnons, non pas des substituts, mais des amis de l’IA qui nous encouragent à sortir et à interagir avec de vraies personnes.”

Lorsque j’ai discuté de ce sujet avec ChatGPT, la réponse que j’ai obtenue était plutôt formelle et rappelait le langage utilisé par un conseiller scolaire : “Il est crucial de trouver un équilibre entre la technologie et les interactions humaines authentiques. L’intelligence artificielle peut être bénéfique en tant qu’outil, mais ne devrait pas se substituer aux relations humaines réelles. Vos réflexions sur ces questions sont louables.”

Alors que la fonction vocale innovante de l’IA permet une interruption et une conversation plus fluide, ChatGPT a tendance à répondre de manière robotique en utilisant des phrases complètes et des paragraphes. Lorsque j’utilise le mode vocal de ChatGPT, je reste conscient que je communique avec un robot, ce qui peut rendre la conversation rigide et artificielle.

LIRE Le représentant Devin Nunes a été temporairement privé de l'accès à son compte Twitter suite à un problème avec la reCAPTCHA.

En comparaison, Gavin Purcell, co-animateur d’un podcast pour l’IA humaine, a partagé sur Reddit une conversation de Sésame Street où il est difficile de distinguer la voix humaine de celle du robot. Purcell a guidé la voix du personnage Miles en lui demandant de jouer le rôle d’un patron en colère.

Après une discussion sur le blanchiment d’argent, la corruption et un événement mystérieux à Malte, une conversation absurde a eu lieu. Miles était parfaitement au fait de la situation, sans aucune hésitation. Le bot se souvenait du contexte de la conversation et développait de manière inventive l’argument improvisé en le renforçant, qualifiant Purcell de “délirant” et le contredisant.

Bien entendu, il y a certaines restrictions. Pendant notre conversation, la voix de Maya a parfois fluctué, et elle n’a pas toujours utilisé la syntaxe correcte, par exemple en disant : “C’est un discours lourd qui arrive.”

D’après sa documentation technique, Sesame a entraîné son CSM en fusionnant le processus traditionnel à deux étapes de formation des modèles de texte en discours sur les jetons sémantiques et acoustiques, réduisant ainsi la latence. OpenAI a suivi une approche similaire pour former son modèle vocal, bien qu’il n’ait jamais partagé de document technique spécifique décrivant le fonctionnement interne du modèle vocal, se contentant de l’évoquer dans la recherche GPT-4o.

Étant donné ces informations, il est étonnant de constater que le modèle de Sesame excelle davantage dans le dialogue. Cependant, étant donné que le lancement de Sesame n’est qu’une démonstration, il conviendrait d’analyser plus en détail le modèle complet lors de sa sortie. Selon l’annonce de la démonstration, Sesame envisage de rendre son modèle accessible “dans les mois à venir” et de l’étendre à plus de 20 langues.

LIRE La collaboration entre l'intelligence artificielle d'Apple et l'intégration de Google Gemini semble sur le point d'arriver prochainement.

ChatGPT

Code Brillant

Commentaires
Commentaires Facebook
Commentaires Disqus

RUPTURE

J’ai comparé Sesame avec le chat vocal de ChatGPT et je ne suis pas informé.

Code Brillant

Laisser un commentaire Annuler la réponse

Restez connecté

Gmail remplace l’authentification par SMS par l’utilisation de…

La télévision ‘Frame’ de Samsung a désormais la capacité de…

Déclaration de Tim Cook, le PDG d’Apple : Il a laissé entendre que…

RUPTURE

Laisser un commentaire Annuler la réponse

Restez connecté

Articles Similaires

Se connecter

Registre

Récupérez votre mot de passe.