Phrases alignées tirées des sites multilingues (français, occitan et parfois anglais) du Congrès
Langues:
occitan, français, anglais
Variantes:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan cisalpin, occitan vivaro
Sujets:
Corpus parallèles
Auteurs
Lo Congrès
Licence:
CC-BY
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/records/12192029#1831
Phrases alignées des corpus servant à entraîner le traducteur automatique MinT.
Langues:
occitan, français, catalan
Variantes:
Sujets:
Corpus parallèles
Auteurs
Wikimedia Foundation
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://dumps.wikimedia.org/other/contenttranslation/#1830
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Langues:
occitan, français, catalan, espagnol, autres
Variantes:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Sujets:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Auteurs
Lo Congrès
Licence:
CC-BY
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/records/8411351#1814
Corpus au format csv, segmenté au niveau de la phrase, généré à partir des actualités publiées sur le site locongres.org.
Langues:
occitan, français
Variantes:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Sujets:
Corpus parallèles
Auteurs
Lo Congrès
Licence:
CC-BY
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/records/8411197#1813
Corpus d'entraînement du système de traduction neuronal de Softcatala, avec des textes alignés du catalan vers plusieurs langues dont l'occitan languedocien.
Langues:
occitan, catalan
Variantes:
occitan languedocien
Sujets:
Corpus parallèles
Auteurs
Softcatala
Licence:
Open source
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://github.com/Softcatala/parallel-catalan-corpus/#1800
Corpus de textes alignés en occitan, français et anglais, à consulter en ligne.
Langues:
occitan, français, anglais, serbe
Variantes:
occitan languedocien
Sujets:
Corpus parallèles
Auteurs
Licence:
© CLLE
Formats:
Base de données interrogeable en ligne
Lien vers la ressource:
http://parcolab.univ-tlse2.fr/parcolaf/#1644
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Langues:
occitan, catalan, espagnol, français, autres
Variantes:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Auteurs
Lo Congrès
Licence:
Licences variées
Formats:
Base de données interrogeable en ligne
Lien vers la ressource:
https://corpus.locongres.com/#1630