COLaF

À travers le projet COLaF (Corpus et Outils pour les Langues de France), Inria a pour objectif de contribuer au développement de corpus et d’outils libres pour le français et les autres langues de France, en étroite collaboration avec des partenaires académiques et institutionnels.

Dans le cadre de ce projet sont prévus :

  • La création de programmes pour acquérir et structurer des textes de corpus (OCR, identification de langue notamment pour les documents plurilingues, formatage TEI)
  • Des modèles de PoS-tagger et de traducteurs automatiques s'appuyant sur des langues dotées pour traiter les langues moins dotées
  • Des travaux autour de la synthèse vocale et de la génération de langue des signes française

Le Congrès est partenaire d'Inria pour intégrer la langue occitane aux développements prévus.

⇒ Visiter la page du projet COlaF