Apprendre une langue en discutant avec une IA

Quazel, une spin-off de l'ETH Zurich, a lancé une application d'apprentissage des langues qui utilise l'intelligence artificielle (IA) pour engager les utilisatrice et utilisateurs dans des conversations. Le tuteur IA s'adapte aux compétences linguistiques des utilisateurs et utilisatrices et corrige leurs erreurs.
Avec l'application Quazel, les apprenants et apprenantes peuvent parler à un tuteur IA dans 21 langues. S'ils ou elles font une erreur, l'application les corrige en temps réel. (Illustration : Quazel)

Résumé

  • Avec l'application Quazel, les apprenantes et apprenants peuvent parler à un tuteur IA dans 21 langues. S'ils ou elles font une erreur, l'application les corrige en temps réel.
  • Le chatbot comprend la qualité de l'expression orale et adapte ses expressions, son choix de mots et la structure de ses phrases en conséquence.
  • L'un des plus grands défis pour les trois fondateurs a été d'apprivoiser les modèles linguistiques accessibles au public.

Le meilleur moyen d'apprendre une langue étrangère est de tenir des conversations régulières avec un professeur ou une professeure de langue qualifié ou une ou un partenaire d'échange linguistique. Mais ce processus peut s'avérer compliqué et coûteux.

Une alternative est la nouvelle application développée par Quazel, une spin-off de l'ETH Zurich, qui permet aux utilisatrices et utilisateurs de discuter avec un tuteur IA sur leur smartphone, où et quand ils et elles le souhaitent. Le tuteur IA parle 21 langues à la perfection et fait preuve d'une patience infinie avec les apprenants et apprenantes !

«Nous voulons rendre l'apprentissage des langues aussi facile et accessible que possible», explique le fondateur et PDG Philipp Hadjimina, qui a étudié l'informatique à l'ETH Zurich. «L'idée est d'aider le plus grand nombre de personnes possible à profiter des avantages d'un tutorat en langue vraiment personnel.»

Conversation fluide avec un chatbot

Jusqu'à récemment, la plupart des applications d'apprentissage des langues se concentraient principalement sur des tâches écrites. Même celles qui offraient une fonction de reconnaissance vocale ne répondaient généralement que par des phrases prédéterminées. Cela donnait souvent une impression artificielle et prescrite aux conversations, au lieu de leur permettre de se dérouler librement. Récemment, cependant, le développement rapide de grands modèles de langage tels que ChatGTP a permis, pour la première fois, d'avoir des conversations fluides et naturelles avec une IA.

Ces avancées technologiques ont également été exploitées par l'application Quazel : «Les apprenants et apprenantes peuvent discuter de presque tout ce qu'elles et ils veulent avec leur tuteur IA, qu'il s'agisse de commander au restaurant, de parler de leur sport favori ou de débattre de questions philosophiques. Et s'ils et elles font une faute de grammaire ou utilisent le mauvais mot, l'application les corrige en temps réel», explique Philipp Hadjimina.

Les conversations commencent généralement par une question posée par le chatbot, à laquelle l'apprenant ou apprenante répond oralement. Pour les débutantes et débutants en particulier, les conversations sont alors principalement alimentées par ces questions du chatbot. Toutefois, au fur et à mesure que la conversation se poursuit, l'IA adapte automatiquement la complexité de ses réponses au niveau de l'apprenante ou apprenant.

Démonstration de Quazel. (Vidéo : ETH Zurich / Quazel)

Exploiter les grands modèles linguistiques

Toutes ces fonctionnalités sont rendues possibles grâce aux modèles de langage de grande taille, accessibles au public, qui tournent dans les coulisses de l'application Quazel. Ces modèles ont été entraînés sur de vastes ensembles de données provenant de sources en ligne, notamment de nombreux livres, articles, sites web et messages sur les médias sociaux. Sur la base de ces données, le tuteur IA a appris les règles grammaticales de 21 langues ainsi que les relations sémantiques typiques entre les mots et les phrases.

Le principe de ces modèles linguistiques est similaire à celui de la fonction de reconnaissance de texte d'un smartphone : sur la base des messages que nous avons tapés dans le passé, et en puisant dans une vaste base de données de mots et de phrases connus, l'IA prédit quel mot est le plus susceptible de venir ensuite dans une séquence.

Quazel fonctionne à peu près de la même manière : «Même si notre chatbot n'a jamais entendu un utilisateur ou une utilisatrice prononcer une certaine phrase d'une certaine manière, il peut néanmoins déterminer la réponse la plus appropriée en fonction du contexte thématique, des conversations passées et de ses connaissances générales», explique David Niederberger, informaticien à l'ETH Zurich, cofondateur et responsable de la technologie de Quazel.

Aider le modèle à s'adapter

L'un des plus grands défis pour les trois fondateurs a été d'apprivoiser les modèles linguistiques accessibles au public. Des modèles tels que le GPT4 d'OpenAI sont devenus si performants que leurs réponses seraient trop compliquées pour les apprenantes et apprenants et les étudiants et étudiantes en langues. «Par exemple, nous avons dû utiliser le retour d'information pour apprendre à notre tuteur linguistique IA à quoi ressemble réellement le son d'une personne de niveau débutant», explique David Niederberger. En bref, le chatbot comprend dans quelle mesure une personne parle une langue et adapte ses expressions, son choix de mots et la structure de ses phrases en conséquence.

Le choix du bon modèle linguistique s'est avéré être une autre source de nuits blanches pour les trois entrepreneurs. Si le modèle est trop complexe, il nécessite une très grande puissance de calcul, ce qui le rend trop cher pour les utilisatrices et utilisateurs finaux. Mais s'il est trop simple, les conversations ne sont pas fluides. «Le choix du modèle a consisté à trouver le bon équilibre entre la complexité et le coût. C'est exactement le genre de dilemme d'ingénierie classique que nous avons rencontré pendant notre séjour à l'ETH Zurich», explique David Niederberger.

Pour compliquer encore les choses, l'évolution rapide du marché des modèles de langues signifie que de nouveaux modèles plus performants apparaissent presque chaque semaine. Les trois fondateurs doivent faire preuve d'une grande flexibilité pour rester au fait des nouveaux développements qui méritent d'être intégrés dans Quazel - et avoir une bonne idée de la façon dont les choses sont susceptibles d'évoluer à l'avenir.

Une forte demande dès le départ

L'automne dernier, les trois fondateurs de l'entreprise ont été invités à rejoindre le célèbre accélérateur de start-ups Y Combinator, et ils travaillent actuellement dans un Airbnb à San Francisco. Dans le cadre de ce programme, ils ont accès à un vaste réseau d'entrepreneurs et entrepreneuses expérimentées et d'investisseuses et investisseurs potentiels.

La popularité de leur application d'apprentissage des langues a été évidente dès son lancement : «Quazel a explosé. En l'espace de deux jours seulement, 50'000 personnes ont utilisé le prototype», explique Philipp Hadjimina. Les fondateurs de Quazel espèrent que cette tendance se poursuivra.