Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).
Lengas:
occitan
Variantas:
occitan aranais
Subjèctes:
Corpus de textes monolingues
Authors:
Licéncia:
©
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://ddd.uab.cat/pub/honsaran/#1829
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Lengas:
occitan, français, catalan, espagnol, autres
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Subjèctes:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/8411351#1814
Corpus textuel réalisé automatiquement en moissonnant le web et la Wikipédia, pour de nombreuses langues dont l'occitan.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Martin Majli
Licéncia:
CC-BY-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0022-6133-9#1811
Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Rudolf Rosa
Licéncia:
CC-BY-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809
Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Université de Leipzig
Licéncia:
CC-BY-NC
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://corpora.wortschatz-leipzig.de/#1808
Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Inria, PRAIRIE Institute
Licéncia:
CC0
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://oscar-project.org/#1806
Corpus généré à partir des pages de discussion de la Wikipèdia en occitan.
Lengas:
occitan
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Academy of Finland
Licéncia:
CC-BY-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/record/7079580#.Y2urH76ZNhF#1632
Journal en ligne d'informations en occitan.
Lengas:
occitan
Variantas:
occitan languedocien, occitan gascon, occitan provençal
Subjèctes:
Corpus de textes monolingues, Corpus multimédia et multimodaux
Authors:
Rédacteur en chef : Ferriòl Macip.
Licéncia:
CC-BY-SA, Copyright
Formats:
Site web
Ligam cap a la ressorsa:
http://www.jornalet.com/#1631
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Lengas:
occitan, catalan, espagnol, français, autres
Variantas:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Authors:
Lo Congrès
Licéncia:
Licences variées
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
https://corpus.locongres.com/#1630
Médiathèque virtuelle avec beaucoup de contenu : expositions virtuelles, malettes pédagogiques, livres et textes anciens numérisés, vidéos documentaires, enregistrements audios
Lengas:
occitan, français, anglais
Variantas:
occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole, Corpus multimédia et multimodaux
Authors:
CIRDÒC-Institut occitan de cultura
Licéncia:
© CIRDÒC
Formats:
Formats divers
Ligam cap a la ressorsa:
http://occitanica.eu#1629
Corpus de textes occitans, dont certains avec leur enregistrement audio.
Lengas:
occitan, français
Variantas:
occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Didier Grange
Licéncia:
© Didier Grange
Formats:
Textes et enregistrements
Ligam cap a la ressorsa:
https://www.marraire.eu#1628
Textes de Roland Pécout avec fichiers audios et vidéos.
Lengas:
occitan, français
Variantas:
occitan provençal
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Roland Pécout, Maria-Joana Verny
Licéncia:
© Université Montpellier III
Formats:
Fichiers flash avec transcription
Ligam cap a la ressorsa:
http://www.univ-montp3.fr/uoh/pecout/#1627
Catalogue du fonds documentaire de Cordae / La Talvera, avec des documents audios et des vidéos, dont certains sont accessibles en ligne et d'autres en consultation sur place.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Association CORDAE La Talvera
Licéncia:
© CORDAE / La Talvera
Formats:
Catalogue de documents
Ligam cap a la ressorsa:
http://cordae-talvera-documentation.kentika.fr/#1626
Transcription des émissions d'information PantaInfo diffusée sur Ràdio Nissa Pantai.
Lengas:
occitan
Variantas:
occitan nissard
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Ràdio Nissa Pantai
Licéncia:
© Nissa Pantai
Formats:
Transcriptions des émissions
Ligam cap a la ressorsa:
http://pantainfo.overblog.com/#1625
Enregistrements audios de petits textes avec leur transcription, pour s'entraîner à la « Dictada occitana ».
Lengas:
occitan
Variantas:
occitan gascon, occitan languedocien, occitan limousin, occitan provençal
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Occitanica, Josiana Ubaud, Alan Roch, Joan Ganhaire, Danís Chapduèlh, Didier Tousis
Licéncia:
© CIRDÒC
Formats:
Enregistrements de petits textes
Ligam cap a la ressorsa:
https://occitanica.eu/items/show/3368#1624
Enregistrements audios d'albums pour les enfants en occitan gascon, languedocien et limousin.
Lengas:
occitan
Variantas:
occitan gascon, occitan languedocien, occitan limousin
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
CAP'ÒC
Licéncia:
© CDDP64, CRDP Bordèu
Formats:
Enregistrements d'albums pour enfants
Ligam cap a la ressorsa:
https://www.capoc.fr/articles.php?lng=fr&pg=176&mnuid=304&tconfig=0#1623
Récits en occitan, avec leur transcription et leur traduction en français, des notices d'information et des lexiques. Récits classés par variété.
Lengas:
occitan, français
Variantas:
occitan auvergnat, occitan languedocien, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Jean-Khalil Atallah, Cécile Bruneteau, Sylvain Bumat, Audrey Richaud
Licéncia:
Copyright
Formats:
Enregistrements de contes avec transcription et traduction
Ligam cap a la ressorsa:
http://www.recits-occitan.com/#1622
Enregistrements audios de livres.
Lengas:
occitan
Variantas:
occitan languedocien, occitan gascon
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Licéncia:
© Letras d'Oc
Formats:
Livres papiers et CD
Ligam cap a la ressorsa:
https://www.letrasdoc.org/fr/rubriques/livres-audio/#1621
Corpus de phrases tirées de traductions de logiciels en occitan.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de textes monolingues
Authors:
Quentin Pagès
Licéncia:
CC-BY-SA
Formats:
Fichiers TMX
Ligam cap a la ressorsa:
https://www.mejans.fr/article/memoria-de-traduccion.html#1620
Portail avec des milliers de paroles de chansons en occitan et dans d'autres langues.
Lengas:
occitan
Variantas:
Subjèctes:
Corpus de textes monolingues
Authors:
Aure Séguier
Licéncia:
Licences variées
Formats:
Pages HTML
Ligam cap a la ressorsa:
http://www.paraulas.net#1619