Callisto
Projets Ressources Communauté Contribuer

Sélectionnez votre langue

  • Français
  • Occitan
  • Accueil
  • A disposition
      • Back
      • La sélection de la Farga
      • API occitanes
      • Inventaire des ressources numériques
      • Nouveautés
      • Standards
      • Lexiques techniques
      • Tutoriels
  • Participez
      • Back
      • Pour commencer
      • Appels à contributions
      • J'ai un projet
      • Notices
      • Serveur Discord
  • La Farga numerica
      • Back
      • Présentation
      • Actualités
      • Notre discord
  • État des lieux
      • Back
      • Les grands domaines
      • Acteurs institutionnels
      • Les grands projets
      • Personnes ressources
      • Publications

Dernières nouvelles :
Jeudi 10 octobre a été officiellement inauguré le portail La Farga numerica.
Participez à la traduction en occitan de Minecraft, le jeu vidéo très apprécié par les adolescents.
Lo Congrès met à disposition trois corpus textuels bilingues et un corpus audio aligné.
Enregistrez des phrases en occitan aranais pour aider au développement de la reconnaissance vocale.
MinT, le traducteur automatique multilingue de la fondation Wikimedia, intègre l'occitan.
  1. État des lieux
  2. Les grands domaines

Etat des lieux

Le TAL (traitement automatique du langage) et les technologies de la langue en occitan ont connu des avancées majeures ces dernières années. La feuille de route pour le développement du numérique occitan, en 2014, avait fixé des objectifs dont la plupart ont été complétés. L'occitan dispose aujourd'hui d'un bon nombre d'outils de traitement automatique du langage, mais il reste encore du travail.

Nous vous proposons ici un état des lieux, outil par outil et ressource par ressource, de ce qui existe pour l'occitan, de ce qui reste à construire et des ressources qui existent pour ce faire.

Nous avons essayé d'être exhaustifs, mais si vous avez connaissance d'une information qui nous a échappé, n'hésitez pas à nous contacter grâce au bouton en bas de page.

Reconnaissance d'entités nommées

Reconnaissance d'entités nommées

  • clavier prédictif
  • ressources
  • lexique monolingue
  • correcteur orthographique
  • traduction automatique
  • entités nommées
  • synthèse vocale
  • reconnaissance vocale

Les traducteurs automatiques basés sur Apertium intègrent la reconnaissance de quelques types d'entités nommées, comme les sites web et les mails. Il y en a d'autres dans les logiciels de synthèse et de reconnaissance vocale (dates, heures, sites web, mails...). 

Lire la suite...

Avenir

Et plus tard...

  • clavier prédictif
  • OCR
  • lexique monolingue
  • correcteur orthographique
  • détecteur de variété
  • analyse morpho-syntaxique
  • lexique bilingue
  • corpus bilingue
  • traduction automatique
  • synthèse vocale
  • reconnaissance vocale
  • API
  • corpus de la parole
  • corpus monolingue

La plupart des outils de base du traitement automatique du langage pour l'occitan sont construits ou sont sur le point de l'être. Les grands chantiers, pour l'avenir, sont de les améliorer, de les étendre à toutes les variétés, de les socialiser et de les utiliser dans de nouveaux outils, en les combinant ou en les enrichissant.

Lire la suite...

Page 3 sur 3

  • 1
  • 2
  • 3
  • A propos de La Farga
  • Informations légales
  • Crédits
  • Droits d'utilisation
  • Données personnelles
  • Plan du site
  • Contact
© 2025 La Farga - Lo Congres

Ce projet est issu du projet Linguatec AI.
Développement des connaissances en intelligence artificielle pour la numérisation de l’aragonais, du catalan, du basque et de l’occitan.
Linguatec IA et CG64