Linguatec AI est la suite du premier projet Linguatec. Cofinancé par le Fonds Européen de Développement Régional à travers l'appel Interreg POCTEFA, il a pour objectif de développer les connaissances en intelligence artificielle sur de nouveaux modèles linguistiques génératifs applicables à des langues aux faibles ressources et leur utilisation pour avancer dans la numérisation de l'aragonais, du catalan, du basque et de l'occitan et dans la construction d'une infrastructure linguistique et intelligente transfrontalière qui facilite la communication entre les locuteurs des différentes langues et l'accès mulitilingue à l'information.
Linguatec est un projet européen transfrontalier POCTEFA de développement des ressources et des outils numériques pour les langues des Pyrénées. Son objectif est, par la coopération transfrontalière et le transfert de technologies, de développer et diffuser des ressources et applications linguistiques innovantes pour l'occitan, l'aragonais et le basque.
Apertium est une plateforme de traduction libre qui fournit un moteur de traduction automatique indépendant de la langue, des outils linguistiques pour gérer les données nécessaires aux paires de langues qui peuvent y être ajoutées et les données créées.
Le projet Còrpus du Congrès a pour but la constitution d'un ensemble de corpus pour le développement d'outils de traitement automatique du langage. Il a un double objectif de quantité (pour pouvoir entraîner des intelligences artificielles) et de représentativité de la diversité de l'espace linguistique occitan.
À travers le projet COLaF (Corpus et Outils pour les Langues de France), Inria a pour objectif de contribuer au développement de corpus et d’outils libres pour le français et les autres langues de France, en étroite collaboration avec des partenaires académiques et institutionnels.
L'objectif du projet ParCoLaF, du laboratoire CLLE,est de faire des ponts entre le français et les autres langues de France en créant des corpus parallèles pour différentes paires de langues, parmi lesquelles la paire occitan-français.
ReVoc est un projet transfrontalier triennal qui a pour but de doter l'occitan et l'aragonais d'une reconnaissance vocale. Les trois membres principaux en sont Lo Congrès, pour la partie occitane, la Rolde de Estudios Aragoneses pour la partie aragonaise et la fondation basque Elhuyar qui se charge de la partie technique.
DiViTal vise à accroître la vitalité et la visibilité de l’alsacien, du corse, de l’occitan et du poitevin-saintongeais. Il se positionne à la croisée de la linguistique descriptive et de la linguistique de corpus. Son but principal est la constitution de ressources, en particulier de corpus textuels bruts et annotés.
Le projet Araina, mené par la coopérative Col·lectivaT, avec la collaboration du groupe SoGeL de l'Université de Lhèida et des membres du Conselh Consultatiu der Aranés, a pour objectif la réalisation d'un grand corpus audio transcrit pour l'occitan aranais.
ROLF est un partenariat entre Lo Congrès, CLLE, Habiter le monde et LiLPa, qui a pour but de développer des ressources de TAL pour trois langues de France : l'occitan, le picard et l'alsacien. Ce projet a débouché sur la création de claviers prédictifs pour les trois langues.