Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).
Langues:
occitan
Variantes:
occitan aranais
Sujets:
Corpus de textes monolingues
Auteurs
Licence:
©
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://ddd.uab.cat/pub/honsaran/#1829
Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.
Langues:
occitan, français, catalan, espagnol, autres
Variantes:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro
Sujets:
Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés
Auteurs
Lo Congrès
Licence:
CC-BY
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/records/8411351#1814
Corpus textuel réalisé automatiquement en moissonnant le web et la Wikipédia, pour de nombreuses langues dont l'occitan.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Martin Majli
Licence:
CC-BY-SA
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0022-6133-9#1811
Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Rudolf Rosa
Licence:
CC-BY-SA
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809
Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Université de Leipzig
Licence:
CC-BY-NC
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://corpora.wortschatz-leipzig.de/#1808
Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.
Langues:
occitan, autres
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Inria, PRAIRIE Institute
Licence:
CC0
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://oscar-project.org/#1806
Corpus généré à partir des pages de discussion de la Wikipèdia en occitan.
Langues:
occitan
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Academy of Finland
Licence:
CC-BY-SA
Formats:
Fichiers téléchargeables
Lien vers la ressource:
https://zenodo.org/record/7079580#.Y2urH76ZNhF#1632
Journal en ligne d'informations en occitan.
Langues:
occitan
Variantes:
occitan languedocien, occitan gascon, occitan provençal
Sujets:
Corpus de textes monolingues, Corpus multimédia et multimodaux
Auteurs
Rédacteur en chef : Ferriòl Macip.
Licence:
CC-BY-SA, Copyright
Formats:
Site web
Lien vers la ressource:
http://www.jornalet.com/#1631
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Langues:
occitan, catalan, espagnol, français, autres
Variantes:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Auteurs
Lo Congrès
Licence:
Licences variées
Formats:
Base de données interrogeable en ligne
Lien vers la ressource:
https://corpus.locongres.com/#1630
Médiathèque virtuelle avec beaucoup de contenu : expositions virtuelles, malettes pédagogiques, livres et textes anciens numérisés, vidéos documentaires, enregistrements audios
Langues:
occitan, français, anglais
Variantes:
occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus de la parole, Corpus multimédia et multimodaux
Auteurs
CIRDÒC-Institut occitan de cultura
Licence:
© CIRDÒC
Formats:
Formats divers
Lien vers la ressource:
http://occitanica.eu#1629
Corpus de textes occitans, dont certains avec leur enregistrement audio.
Langues:
occitan, français
Variantes:
occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Didier Grange
Licence:
© Didier Grange
Formats:
Textes et enregistrements
Lien vers la ressource:
https://www.marraire.eu#1628
Textes de Roland Pécout avec fichiers audios et vidéos.
Langues:
occitan, français
Variantes:
occitan provençal
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Roland Pécout, Maria-Joana Verny
Licence:
© Université Montpellier III
Formats:
Fichiers flash avec transcription
Lien vers la ressource:
http://www.univ-montp3.fr/uoh/pecout/#1627
Catalogue du fonds documentaire de Cordae / La Talvera, avec des documents audios et des vidéos, dont certains sont accessibles en ligne et d'autres en consultation sur place.
Langues:
occitan
Variantes:
occitan languedocien
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Association CORDAE La Talvera
Licence:
© CORDAE / La Talvera
Formats:
Catalogue de documents
Lien vers la ressource:
http://cordae-talvera-documentation.kentika.fr/#1626
Transcription des émissions d'information PantaInfo diffusée sur Ràdio Nissa Pantai.
Langues:
occitan
Variantes:
occitan nissard
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Ràdio Nissa Pantai
Licence:
© Nissa Pantai
Formats:
Transcriptions des émissions
Lien vers la ressource:
http://pantainfo.overblog.com/#1625
Enregistrements audios de petits textes avec leur transcription, pour s'entraîner à la « Dictada occitana ».
Langues:
occitan
Variantes:
occitan gascon, occitan languedocien, occitan limousin, occitan provençal
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Occitanica, Josiana Ubaud, Alan Roch, Joan Ganhaire, Danís Chapduèlh, Didier Tousis
Licence:
© CIRDÒC
Formats:
Enregistrements de petits textes
Lien vers la ressource:
https://occitanica.eu/items/show/3368#1624
Enregistrements audios d'albums pour les enfants en occitan gascon, languedocien et limousin.
Langues:
occitan
Variantes:
occitan gascon, occitan languedocien, occitan limousin
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
CAP'ÒC
Licence:
© CDDP64, CRDP Bordèu
Formats:
Enregistrements d'albums pour enfants
Lien vers la ressource:
https://www.capoc.fr/articles.php?lng=fr&pg=176&mnuid=304&tconfig=0#1623
Récits en occitan, avec leur transcription et leur traduction en français, des notices d'information et des lexiques. Récits classés par variété.
Langues:
occitan, français
Variantes:
occitan auvergnat, occitan languedocien, occitan vivaro
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Jean-Khalil Atallah, Cécile Bruneteau, Sylvain Bumat, Audrey Richaud
Licence:
Copyright
Formats:
Enregistrements de contes avec transcription et traduction
Lien vers la ressource:
http://www.recits-occitan.com/#1622
Enregistrements audios de livres.
Langues:
occitan
Variantes:
occitan languedocien, occitan gascon
Sujets:
Corpus de textes monolingues, Corpus de la parole
Auteurs
Licence:
© Letras d'Oc
Formats:
Livres papiers et CD
Lien vers la ressource:
https://www.letrasdoc.org/fr/rubriques/livres-audio/#1621
Corpus de phrases tirées de traductions de logiciels en occitan.
Langues:
occitan
Variantes:
occitan languedocien
Sujets:
Corpus de textes monolingues
Auteurs
Quentin Pagès
Licence:
CC-BY-SA
Formats:
Fichiers TMX
Lien vers la ressource:
https://www.mejans.fr/article/memoria-de-traduccion.html#1620
Portail avec des milliers de paroles de chansons en occitan et dans d'autres langues.
Langues:
occitan
Variantes:
Sujets:
Corpus de textes monolingues
Auteurs
Aure Séguier
Licence:
Licences variées
Formats:
Pages HTML
Lien vers la ressource:
http://www.paraulas.net#1619