Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).
Lengas:
occitan
Variantas:
occitan aranais
Subjèctes:
Corpus de textes monolingues
Authors:
Licéncia:
©
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://ddd.uab.cat/pub/honsaran/#1829
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Lengas:
occitan, français, catalan, espagnol, autres
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Subjèctes:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/8411351#1814
Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Rudolf Rosa
Licéncia:
CC-BY-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809
Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Université de Leipzig
Licéncia:
CC-BY-NC
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://corpora.wortschatz-leipzig.de/#1808
Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Inria, PRAIRIE Institute
Licéncia:
CC0
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://oscar-project.org/#1806
Corpus généré à partir des pages de discussion de la Wikipèdia en occitan.
Lengas:
occitan
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Academy of Finland
Licéncia:
CC-BY-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/record/7079580#.Y2urH76ZNhF#1632
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Lengas:
occitan, catalan, espagnol, français, autres
Variantas:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Authors:
Lo Congrès
Licéncia:
Licences variées
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
https://corpus.locongres.com/#1630
Corpus de phrases tirées de traductions de logiciels en occitan.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de textes monolingues
Authors:
Quentin Pagès
Licéncia:
CC-BY-SA
Formats:
Fichiers TMX
Ligam cap a la ressorsa:
https://www.mejans.fr/article/memoria-de-traduccion.html#1620
Version téléchargeable de l'encyclopédie libre et collaborative en occitan.
Lengas:
occitan
Variantas:
occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues
Authors:
Licéncia:
CC-BY-SA
Formats:
Dossier à télécharger avec des fichiers XML
Ligam cap a la ressorsa:
https://dumps.wikimedia.org/#1612
Base textuelle occitane qualitative, avec une attention particulière portée à la diversité des genres et des variétés.
Lengas:
occitan
Variantas:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues
Authors:
CLLE
Licéncia:
© CLLE
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
http://redac.univ-tlse2.fr/bateloc/#1608