Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).
Langues:
occitan
Variantes:
occitan aranais
Sujets:
Corpus de textes monolingues
Auteurs
Licence:
©
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://ddd.uab.cat/pub/honsaran/#1829
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Langues:
occitan, français, catalan, espagnol, autres
Variantes:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Sujets:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Auteurs
Lo Congrès
Licence:
CC-BY
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/records/8411351#1814
Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Rudolf Rosa
Licence:
CC-BY-SA
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809
Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Université de Leipzig
Licence:
CC-BY-NC
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://corpora.wortschatz-leipzig.de/#1808
Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Inria, PRAIRIE Institute
Licence:
CC0
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://oscar-project.org/#1806
Corpus généré à partir des pages de discussion de la Wikipèdia en occitan.
Langues:
occitan
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Academy of Finland
Licence:
CC-BY-SA
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/record/7079580#.Y2urH76ZNhF#1632
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Langues:
occitan, catalan, espagnol, français, autres
Variantes:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Auteurs
Lo Congrès
Licence:
Licences variées
Formats:
Base de données interrogeable en ligne
Lien vers la ressource:
https://corpus.locongres.com/#1630
Corpus de phrases tirées de traductions de logiciels en occitan.
Langues:
occitan
Variantes:
occitan languedocien
Sujets:
Corpus de textes monolingues
Auteurs
Quentin Pagès
Licence:
CC-BY-SA
Formats:
Fichiers TMX
Lien vers la ressource:
https://www.mejans.fr/article/memoria-de-traduccion.html#1620
Version téléchargeable de l'encyclopédie libre et collaborative en occitan.
Langues:
occitan
Variantes:
occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues
Auteurs
Licence:
CC-BY-SA
Formats:
Dossier à télécharger avec des fichiers XML
Lien vers la ressource:
https://dumps.wikimedia.org/#1612
Base textuelle occitane qualitative, avec une attention particulière portée à la diversité des genres et des variétés.
Langues:
occitan
Variantes:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues
Auteurs
CLLE
Licence:
© CLLE
Formats:
Base de données interrogeable en ligne
Lien vers la ressource:
http://redac.univ-tlse2.fr/bateloc/#1608