Corpus parallèles de Softcatalà

Softcatalà a ouvert le projet d'un traducteur automatique occitan - catalan par réseaux neuronaux. Dans ce cadre, il a construit plusieurs ressources qu'il met à disposition de la communauté.

Il propose tout d'abord une base de corpus parallèles du catalan vers plusieurs langues, dont l'occitan languedocien. Il a également publié sous licence libre les modèles neuronaux qu'il a entraîné pour développer son traducteur. Là aussi, on trouve la paire catalan - occitan languedocien.

Softcatalà a déjà un traducteur automatique occitan - catalan, mais il est basé sur Apertium, qui fonctionne à base de règles. Il travaille à présent à créer un traducteur neuronal pour cette paire de langues grâce au transfert de connaissance des modèles publiés par Meta com dans le cadre du projet No Language Left Behind.

⇒ En savoir plus sur le projet de Softcatalà
⇒ Voir les corpus libres
⇒ Voir les modèles neuronaux