Publicité

Projet de recherche

Kreol Morisien pe fer firer dan liniversite dan Lamerik

19 juin 2026, 16:00

Par

Partager cet article

Facebook X WhatsApp

Kreol Morisien pe fer firer dan liniversite dan Lamerik

■ Fabiola Henri, docteure en linguistique ( 2e à partir de la g.) et une partie de ses élèves ont fait le voyage des États-Unis à Flic-en-Flac. Photos: Aline Groëme-Harmon

Sept étudiants de quatre universités américaines ont traversé l’Atlantique pour poursuivre leurs travaux sur des langues créoles à Maurice. L’équipe est dirigée par la mauricienne Fabiola Henri, docteure en linguistique à l’université d’État de New York à Buffalo. Parmi les objectifs de ce vaste projet de recherche : enregistrer plusieurs heures de parole en «Kreol Morisien», pour entraîner un modèle d’intelligence artificielle (IA) de Reconnaissance automatique de la parole.

Toultan kifer? Pourquoi huit personnes – profs et étudiants inclus – ont-elles fait le voyage d’Amérique, jusqu’à Flic-en Flac ? L’équipe est dirigée par la docteure en linguistique Fabiola Henri, qui enseigne au Department of Romance Languages & Literatures, ainsi qu’au département de linguistique à l’université d’État de New York à Buffalo. Elle a obtenu des financements «d’environ un million de dollars», pour deux projets d’études sur les langues créoles (Morisien, Guadeloupéen, Seychellois, Martiniquais et celui de la Guyane française) de la National Science Foundation, organisme qui finance la recherche universitaire aux États-Unis. D’abord un projet de deux ans, puis un projet de cinq ans qui mènera l’équipe dans les divers pays concernés.

Avant même de lui poser l’éternelle question : à quoi ça sert d’étudier le kreol – dans sa globalité – au niveau universitaire, en Amérique, Fabiola Henri a déjà anticipé. Avec un brin d’ironie, elle explique : «Il y a très longtemps, il n’y avait pas les outils permettant d’affirmer que la terre est ronde. On disait que la terre était plate. Il a fallu traverser les océans, observer le soleil pour dire que la terre est ronde. Nou finn ariv sa pwin-la pou kreol.»

Reconnaissance automatique de la parole : «Le volet technique n’est pas un problème»

L’un des volets de cette étude universitaire est : Advancing Language Technologies for Creole Languages seeks to develop automatic speech recognition, voice synthesis and Large Language Models specifically for creole languages. Il est mené par Fabiola Henri et Eric Le Ferrand, chercheur post-doctoral.

«Pour nous, le volet technique n’est pas un problème du tout. Se dimounn ki anvi met sa kouma enn baryer.» Fabiola Henri insiste : avec le modèle IA existant, c’est possible non seulement de retranscrire la parole en texte, mais aussi de la traduire.

«Pour créer ce type de technologie, il nous faut des données, mais les données sur des langues comme le kreol sont assez rares.» Quelles données sont requises ? Elles sont de deux sortes, précise Eric Le Ferrand. «D’un côté, il nous faut des données brutes, c’est-à-dire des quantités énormes de textes.» Textes littéraires ? Non, tous genres de textes écrits en Kreol Morisien (KM). D’un autre côté, «il nous faut beaucoup d’enregistrements de la parole».

Pour arriver au pairage entre input (l’enregistrement de gens qui parlent) et output (la transcription de ce qu’ils ont dit). Le degré de précision dépend de l’entraînement qu’a subi le modèle IA. L’exercice est de maitriser les correspondances entre les sons et leurs équivalents à l’écrit, afin de produire un texte «correct».

Selon Eric Le Ferrand, à l’heure actuelle, «on arrive à créer des modèles à partir de très peu de données», soit environ trois, quatre heures d’enregistrement. Des débuts qui «sont quand même assez intéressants. Le souci, c’est que plusieurs textes produits sont des traductions du français». Fabiola Henri est catégorique : «Les bulletins d’infos en KM de certains médias sont des calques du français, des traductions littérales alors qu’un même mot en français et en KM, ne signifie pas toujours la même chose. Dans ces traductions littérales, la str ucture des phrases aussi est calquée sur le français. Ce n’est pas ce qu’on veut. On veut de la parole spontanée, kouma dimounn koze vremem».

L’autre aspect problématique, à l’oral, dans certains bulletins d’informations, note-t-elle, c’est la prosodie : l’intonation, le rythme, le débit, l’accentuation etc. «La prosodie utilisée est française, pas mauricienne du tout. Si on veut créer des technologies fiables, il nous faut de la vraie parole associée à du texte. Mais on ne produit pas assez de textes en KM. Ce qui pose un obstacle en termes de volume de données.» D’où la pertinence des travaux qui sont menés ici jusqu’au 1er juillet.

«Notre but est d’aller vers les gens, de les enregistrer, de leur permettre de dire ce qu’ils ont à dire. Cela va générer une collection de données et donnera des transcriptions qui correspondent vraiment au parler mauricien de la vie de tous les jours.» L’objectif pour améliorer le modèle de Reconnaissance automatique de la parole : «On vise cinq heures de parole enregistrée.»


Remise en question des théories établies : Du pidgin au créole, «ce n’est pas prouvé»

Histoire vécue la semaine dernière par l’équipe. Elle a dégusté de succulents kari lor fey banann à Pamplemousses. Question à une dame rencontrée sur place : quel est votre emploi ? Réponse : elle est servante. Comment s’appelle un homme qui accomplit les mêmes tâches ? «Il n’y a pas de mot. Nous avons une perception biaisée du français par rapport au genre», conclut Fabiola Henri.

Le postulat, c’est que l’accord selon le genre n’existe pas dans des langues créoles parce que ce sont des langues simplifiées. «Sa se seki zot dir. Pou mwa, se enn fos lide», affirme Fabiola Henri. L’une des étudiantes actuellement à Maurice, Mary-Evelyne White, qui est en cours de linguistique, niveau Master, a choisi pour thème : Comparative study of Lexical gender marking (gendered job titles) in Mauritian and Haitian Creoles.

WhatsApp Image 2026-06-19 at 10.23.23 AM

Fabiola Henri, elle, va plus loin. L’une des théories qui explique les débuts et l’évolution des langues créoles c’est «du pidgin au créole». Selon cette théorie, le pidgin est né pour faciliter la communication entre personnes qui n’avaient pas la même langue en commun. Quand une nouvelle génération est devenue des locuteurs natifs de cette langue de communication, celle-ci est devenue une langue créole. «Scientifiquement, cette théorie n’est pas prouvée.» Alors qu’elle est toujours enseignée, y compris à l’université de Maurice, Fabiola Henri affirme : «Il est temps d’arrêter.»


Des entretiens rémunérés à 20 dollars par heure

Les locuteurs natifs de KM sont invités à prendre part aux travaux de cette équipe. La participation est sur une base volontaire. Il sera demandé aux participants de se prêter à des interviews et des activités liées aux recherches sur le langage. Toutes les informations recueillies resteront confidentielles assure l’équipe. Les interviews durent au moins une heure. Les participants seront compensés au taux de 20 dollars (Rs 950) par heure.

Contact : [email protected]

L’équipe sur le terrain

L’équipe qui a fait le déplacement travaille sur deux projets financés par la National Science Foundation des USA . Premier volet : Documenting and Analyzing Creole Languages.Ce programme de recherches international permet à des étudiants de différents niveaux de mener des études de terrain en linguistique. Le groupe se compose de :

Donna Park doctorante en linguistique, de l’University at Buffalo. Son sujet : Serial Verb Constructions.

Aminah Raysor, doctorante en éducation de l’University at Buffalo. Son sujet : Raciolinguistics and Education ;

Tamara Svehla, doctorante en linguistique à l’Ohio State University, qui est actuellement à Syracuse University. Son thème : Phonology and Prosody ;

Mary-Evelyne White, qui est en Masters en linguistique, à l’université d’Aix Marseille, qui est actuellement à Tulane University. Son sujet: Comparative study of Lexical gender marking (gendered job titles) in Mauritian and Haitian Creoles ;

Ashkay Lakharam, undergraduate de l’University of Rochester qui planche sur une Comparative study of Serial verb constructions in Creolese and Mauritian Creole ;

Amaya Saunders, qui est en Masters Computational Linguistics à l’University of Washington. Elle travaille sur Phonetics and Automatic Speech Recognition.

L’autre aspect du projet c’est, Advancing Language Technologies for Creole Languages. Ce qui concerne l’entrainement d’un modèle de Reconnaissance automatique de la parole.

Publicité