Linguatec AI est la suite du premier projet Linguatec. Cofinancé par le Fonds Européen de Développement Régional à travers l'appel Interreg POCTEFA, il a pour objectif de développer les connaissances en intelligence artificielle sur de nouveaux modèles linguistiques génératifs applicables à des langues aux faibles ressources et leur utilisation pour avancer dans la numérisation de l'aragonais, du catalan, du basque et de l'occitan et dans la construction d'une infrastructure linguistique et intelligente transfrontalière qui facilite la communication entre les locuteurs des différentes langues et l'accès mulitilingue à l'information.
Le consortium de ce projet transfrontalier est dirigé par Elhuyar (à travers son centre d'intelligence artificielle Orai) et composé du Congrès, HITZ zentroa (UPV/EHU), l’Université Toulouse - Jean Jaurès (laboratoire CLLE), l’Université de Perpignan, IKER-CNRS de Bayonne, le Gouvernement d'Aragon et le groupe SoGeL de l'Université de Lhèida.
Dans ce cadre, et avec l'aide de Col·lectivaT, il est prévu pour l'occitan d'améliorer le traducteur automatique Revirada et d'y ajouter la variété aranaise, ainsi que la paire de langue occitan-catalan, d'améliorer la synthèse vocale Votz et d'y ajouter la variété aranaise, de créer un outil public de reconnaissance vocale en occitan et une plateforme de sous-titrage en occitan en ligne. Seront également construits les lexiques monolingues, bilingues et les corpus audio et monolingue nécessaires pour le développement de tous ces outils, ainsi qu'un lexique occitan multigraphie et multivariété.