Callisto
Projets Ressources Communauté Contribuer

Sélectionnez votre langue

  • Français
  • Occitan
  • Accueil
  • A disposition
      • Back
      • La sélection de la Farga
      • API occitanes
      • Inventaire des ressources numériques
      • Nouveautés
      • Standards
      • Lexiques techniques
      • Tutoriels
  • Participez
      • Back
      • Pour commencer
      • Appels à contributions
      • J'ai un projet
      • Notices
      • Serveur Discord
  • La Farga numerica
      • Back
      • Présentation
      • Actualités
      • Notre discord
  • État des lieux
      • Back
      • Les grands domaines
      • Acteurs institutionnels
      • Les grands projets
      • Personnes ressources
      • Publications

Dernières nouvelles :
Jeudi 10 octobre a été officiellement inauguré le portail La Farga numerica.
Participez à la traduction en occitan de Minecraft, le jeu vidéo très apprécié par les adolescents.
Lo Congrès met à disposition trois corpus textuels bilingues et un corpus audio aligné.
Enregistrez des phrases en occitan aranais pour aider au développement de la reconnaissance vocale.
MinT, le traducteur automatique multilingue de la fondation Wikimedia, intègre l'occitan.
  1. État des lieux
  2. Les grands projets

Les grands projets

Linguatec AI

Linguatec AI

  • lexique monolingue
  • lexique bilingue
  • traduction automatique
  • synthèse vocale
  • reconnaissance vocale
  • Congrès
  • CLLE
  • corpus de la parole
  • Elhuyar
  • corpus monolingue

Linguatec AI est la suite du premier projet Linguatec. Cofinancé par le Fonds Européen de Développement Régional à travers l'appel Interreg POCTEFA, il a pour objectif de développer les connaissances en intelligence artificielle sur de nouveaux modèles linguistiques génératifs applicables à des langues aux faibles ressources et leur utilisation pour avancer dans la numérisation de l'aragonais, du catalan, du basque et de l'occitan et dans la construction d'une infrastructure linguistique et intelligente transfrontalière qui facilite la communication entre les locuteurs des différentes langues et l'accès mulitilingue à l'information.

Lire la suite...

Linguatec

Linguatec

  • outils
  • ressources
  • lexique monolingue
  • lexique bilingue
  • traduction automatique
  • synthèse vocale
  • Congrès
  • CLLE
  • Elhuyar
  • corpus monolingue

Linguatec est un projet européen transfrontalier POCTEFA de développement des ressources et des outils numériques pour les langues des Pyrénées. Son objectif est, par la coopération transfrontalière et le transfert de technologies, de développer et diffuser des ressources et applications linguistiques innovantes pour l'occitan, l'aragonais et le basque.

Lire la suite...

Apertium

Apertium

  • outils
  • traduction automatique
  • Congrès
  • Apertium

Apertium est une plateforme de traduction libre qui fournit un moteur de traduction automatique indépendant de la langue, des outils linguistiques pour gérer les données nécessaires aux paires de langues qui peuvent y être ajoutées et les données créées.

Lire la suite...

Còrpus

Còrpus

  • ressources
  • corpus bilingue
  • corpus
  • Congrès
  • corpus de la parole
  • corpus monolingue

Le projet Còrpus du Congrès a pour but la constitution d'un ensemble de corpus pour le développement d'outils de traitement automatique du langage. Il a un double objectif de quantité (pour pouvoir entraîner des intelligences artificielles) et de représentativité de la diversité de l'espace linguistique occitan.

Lire la suite...

Lexics

Lexics

  • ressources
  • lexique monolingue
  • lexique bilingue
  • TEI
  • lexiques
  • Congrès

Ce projet du Congrès a pour but de formater en XML (selon la norme TEI) tous les dictionnaires, lexiques spécialisés, bases toponymiques, lexiques flexionnels contenus dans son Dicodòc et d'utiliser ces lexiques formatés pour créer de nouvelles ressources.

Lire la suite...

COLaF

COLaF

  • pos-tagger
  • OCR
  • détecteur de langue
  • traduction automatique
  • synthèse vocale
  • Congrès
  • corpus monolingue

À travers le projet COLaF (Corpus et Outils pour les Langues de France), Inria a pour objectif de contribuer au développement de corpus et d’outils libres pour le français et les autres langues de France, en étroite collaboration avec des partenaires académiques et institutionnels.

Lire la suite...

Parcolab

ParCoLaF

  • ressources
  • TEI
  • CLLE

L'objectif du projet ParCoLaF, du laboratoire CLLE,est de faire des ponts entre le français et les autres langues de France en créant des corpus parallèles pour différentes paires de langues, parmi lesquelles la paire occitan-français.

Lire la suite...

ReVoc

ReVoc

  • outils
  • reconnaissance vocale
  • Congrès
  • corpus de la parole
  • Elhuyar

ReVoc est un projet transfrontalier triennal qui a pour but de doter l'occitan et l'aragonais d'une reconnaissance vocale. Les trois membres principaux en sont Lo Congrès, pour la partie occitane, la Rolde de Estudios Aragoneses pour la partie aragonaise et la fondation basque Elhuyar qui se charge de la partie technique.

Lire la suite...

DiViTal

DiViTal

  • CLLE
  • corpus monolingue

DiViTal vise à accroître la vitalité et la visibilité de l’alsacien, du corse, de l’occitan et du poitevin-saintongeais. Il se positionne à la croisée de la linguistique descriptive et de la linguistique de corpus. Son but principal est la constitution de ressources, en particulier de corpus textuels bruts et annotés.

Lire la suite...

Araina

Araina

  • reconnaissance vocale
  • corpus de la parole

Le projet Araina, mené par la coopérative Col·lectivaT, avec la collaboration du groupe SoGeL de l'Université de Lhèida et des membres du Conselh Consultatiu der Aranés, a pour objectif la réalisation d'un grand corpus audio transcrit pour l'occitan aranais.

Lire la suite...

ROLF

ROLF

  • outils
  • clavier prédictif
  • lexique monolingue
  • Congrès
  • CLLE

ROLF est un partenariat entre Lo Congrès, CLLE, Habiter le monde et LiLPa, qui a pour but de développer des ressources de TAL pour trois langues de France : l'occitan, le picard et l'alsacien. Ce projet a débouché sur la création de claviers prédictifs pour les trois langues.

Lire la suite...

Restaure

RESTAURE

  • outils
  • tokenizer
  • OCR
  • ressources
  • analyse morpho-syntaxique
  • CLLE

L'objectif de RESTAURE est de fournir des ressources informatiques et des outils de TAL pour trois langues de France : l'occitan, l'alsacien et le picard. Il rassemble les laboratoires CLLE, LiLPa, Limsi et LESCLAP.

Lire la suite...

  • A propos de La Farga
  • Informations légales
  • Crédits
  • Droits d'utilisation
  • Données personnelles
  • Plan du site
  • Contact
© 2025 La Farga - Lo Congres

Ce projet est issu du projet Linguatec AI.
Développement des connaissances en intelligence artificielle pour la numérisation de l’aragonais, du catalan, du basque et de l’occitan.
Linguatec IA et CG64