Le projet Linguatec AI, projet européen transfrontalier qui est la suite du premier projet Linguatec, a été lancé au premier semestre 2024. Sa thématique centrale est le développement de connaissances en intelligence artificielle applicables aux langues peu dotées, des deux côtés des Pyrénées. Un consortium de structures occitanes, basques, aragonaises et catalanes y travailleront ensemble, partageant leurs connaissances et compétences.
Au niveau concret, Linguatec AI permettra de développer ou d'améliorer des outils de traitement automatique du langage pour les langues concernées. Pour l'occitan, le but premier est d'intégrer l'occitan aranais aux outils déjà développés par l'occitan gascon et l'occitan languedocien (traduction automatique, synthèse vocale, reconnaissance vocale, multidictionnaire en ligne) et de créer les ressources nécessaires au développement de ces outils (corpus textuel monolingue, corpus bilingue, corpus audio aligné, lexiques monolingues, lexiques bilingues).
Les outils qui existent pour l'occitan gascon et l'occitan languedocien seront aussi améliorés, et une interface publique est prévue pour rendre accessible la reconnaissance vocale, qui pour le moment est seulement sous la forme d'un moteur qui ne peut pas être directement utilisé.
Le Congrès, CLLE, le groupe SoGeL de l'Université de Lérida, Elhuyar et Col·lectivaT vont travailler ensemble pendant plusieurs années pour faire tous ces développements.