Phrases alignées tirées des sites multilingues (français, occitan et parfois anglais) du Congrès
Lengas:
occitan, français, anglais
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan cisalpin, occitan vivaro
Subjèctes:
Corpus parallèles
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/12192029#1831
Phrases alignées des corpus servant à entraîner le traducteur automatique MinT.
Lengas:
occitan, français, catalan
Variantas:
Subjèctes:
Corpus parallèles
Authors:
Wikimedia Foundation
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://dumps.wikimedia.org/other/contenttranslation/#1830
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Lengas:
occitan, français, catalan, espagnol, autres
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Subjèctes:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/8411351#1814
Corpus au format csv, segmenté au niveau de la phrase, généré à partir des actualités publiées sur le site locongres.org.
Lengas:
occitan, français
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Subjèctes:
Corpus parallèles
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/8411197#1813
Corpus d'entraînement du système de traduction neuronal de Softcatala, avec des textes alignés du catalan vers plusieurs langues dont l'occitan languedocien.
Lengas:
occitan, catalan
Variantas:
occitan languedocien
Subjèctes:
Corpus parallèles
Authors:
Softcatala
Licéncia:
Open source
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://github.com/Softcatala/parallel-catalan-corpus/#1800
Corpus de textes alignés en occitan, français et anglais, à consulter en ligne.
Lengas:
occitan, français, anglais, serbe
Variantas:
occitan languedocien
Subjèctes:
Corpus parallèles
Authors:
Licéncia:
© CLLE
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
http://parcolab.univ-tlse2.fr/parcolaf/#1644
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Lengas:
occitan, catalan, espagnol, français, autres
Variantas:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Authors:
Lo Congrès
Licéncia:
Licences variées
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
https://corpus.locongres.com/#1630