Le Centre pour la langue luxembourgeoise a présenté une application web pour rendre le luxembourgeois plus accessible.
Hasard du calendrier sans doute, mais tandis qu’à Paris s’ouvrait le sommet sur l’intelligence artificielle, le Luxembourg n’était pas en reste hier après-midi. Le Centre pour la langue luxembourgeoise (ZLS) a dévoilé, au ministère de la Culture, un nouvel outil basé sur des modèles d’intelligence artificielle.
Une application web unique en son genre de reconnaissance et de synthèse vocales. Enfin, unique au Luxembourg, car il en existe déjà pour la plupart des langues parlées.
«Le luxembourgeois est une low-resource language», explique Daniel Wagener, linguiste au ZLS avec un anglicisme propre à son métier. «Les langues à faibles ressources» sont celles pour lesquelles les chercheurs disposent de peu de données pour la formation des systèmes d’IA conversationnelle.
«On n’a pas beaucoup d’audio enregistré en luxembourgeois», regrette le linguiste. Si bien que pendant deux ans, le système a été entraîné principalement avec des données provenant du Lëtzebuerger Online Dictionnaire (LOD), le dictionnaire luxembourgeois en ligne.
Enrichir l’application
Malgré la difficulté de trouver des ressources, Sproochmaschinn.lu est bel et bien disponible pour le grand public depuis hier. Il est certes encore en phase de test et distingue mal, par exemple, les mots avec ou sans accent dont le sens change pourtant. Mais comme tout logiciel basé sur l’IA, il s’améliorera à force d’entendre de nouvelles expressions.
«On n’arrivera pas du jour au lendemain à un modèle qui transcrira sans faute un vocabulaire très spécialisé», précise Daniel Wagener. «Plus les données d’entraînement contiennent des données avec des accents et du vocabulaire différents, plus il va s’habituer à les reconnaître», ajoute-t-il.
D’ailleurs, comme le site n’enregistre pas ce qui est publié par les utilisateurs – question de confidentialité et de respect des données personnelles –, le grand public et les entreprises sont invités à faire part au ZLS de mots ou expressions spécifiques à certains domaines, histoire d’enrichir l’application.
Lecture à voix haute
Mais comment fonctionne-t-elle? Après s’être connecté sur sproochmaschinn.lu, l’utilisateur tombe sur une interface dépouillée, facile d’accès – surtout pour une personne maîtrisant le luxembourgeois, parce qu’elle n’est disponible que dans cette langue. Il est alors possible d’enregistrer en direct quelqu’un qui parle, mais aussi d’exporter un fichier audio ou vidéo.
L’IA le transcrira dans une limite de 50 Mo. Il ne restera plus qu’à sauvegarder ce texte sous forme de texte brut ou avec des horodatages intégrés. Utile aux personnes chargées de prendre des notes pendant une réunion, mais aussi à celles voulant générer des sous-titres sous une vidéo.
En plus de cette retranscription, la plateforme permet de convertir du texte écrit en une langue parlée, une possibilité qui n’existait pas, elle non plus, en luxembourgeois. Une fonction pourtant indispensable à celles et ceux ayant des difficultés à voir ou à lire.
Une «première étape»
Pour utiliser cette facette du site, il suffit de taper ou copier un texte de 10 000 caractères maximum dans la fenêtre dédiée, et magie du numérique, une voix le lira. Le ministère de la Culture tient à rassurer les plus récalcitrants face à l’intelligence artificielle : «L’outil conserve toujours une touche humaine : les données audio avec lesquelles l’intelligence artificielle a été entraînée ont été lues par Max Kuborn, collaborateur de longue date de RTL, qui prête pour ainsi dire sa voix à la machine à lire.»
Cette «machine à lire et à écrire» n’est qu’une première étape, prévient Daniel Wagener. Le linguiste et les employés du ZLS, qui ont commencé à y penser dès 2022, visent désormais à l’intégrer sur des sites ou logiciels. Avec cette implémentation, les pages d’un journal ou d’une entreprise sur internet pourraient être lues à voix haute, là aussi une façon d’inclure les personnes malvoyantes.
Bientôt une possibilité de traduire?
Mais ce n’est pas tout : en ce moment, le ZLS œuvre pour que la plateforme dispose dans le futur d’une possibilité de traduction. «On est en train de travailler sur un corpus multilingue qui permettra de traduire vers le luxembourgeois, mais aussi à partir du luxembourgeois, dans les langues principales du Grand-Duché. Là aussi, ce sera une première étape. On n’en est qu’au tout début, mais c’est quelque chose qu’on envisage», glisse le linguiste avec un grand sourire.
En plus de l’aspect utilitaire et inclusif, cette plateforme poursuit un autre objectif : promouvoir la langue luxembourgeoise. Comment? Daniel Wagener n’hésite pas avant de répondre : «Ça va la rendre plus accessible.» Sproochmaschinn.lu fait en effet partie de la stratégie de promotion de la langue luxembourgeoise, lancée par le gouvernement.
Un plan composé d’une cinquantaine de mesures a été décrété pour que la langue de Dicks, qui est, selon les dernières données du Statec, de moins en moins parlée dans le pays, ait encore de beaux jours devant elle.