Corpus de langue parlée basé sur des données linguistiques crowdsourcées composées d'enregistrements audios et d'un peu de réponses écrites ou à des QCM. Il comprend les langues parlées à travers les régions alpines d'Italie.
Lengas:
occitan, autres
Variantas:
occitan vivaro
Subjèctes:
Corpus de la parole
Authors:
Rabanus, S., Kruijt, A., Alber, B., Bidese, E., Gaeta, L., & Raimondi, G.
Licéncia:
CC-BY-NC-SA
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/13144330#1836
Corpus audio aligné collaboratif créé dans le cadre de ReVoc, le projet de reconnaissance vocale occitane.
Lengas:
occitan
Variantas:
occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan nissard
Subjèctes:
Corpus de la parole
Authors:
Lo Congrès
Licéncia:
CC-BY
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://zenodo.org/records/11566430#1832
Site web pour écouter des mots occitans prononcés.
Lengas:
occitan, autres
Variantas:
Subjèctes:
Corpus de la parole
Authors:
Licéncia:
Copyright
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
https://fr.forvo.com/languages/oc/#1763
Lexique trilingue occitan-français-anglais avec les mots occitans à écouter.
Lengas:
occitan, français, anglais
Variantas:
occitan vivaro
Subjèctes:
Lexiques bilingues, Corpus de la parole
Authors:
Marraire
Licéncia:
© Marraire
Formats:
Dictionnaire en ligne à interroger
Ligam cap a la ressorsa:
https://www.marraire.eu/Descubrir/Mots/Mots.php#1760
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
Lengas:
occitan, catalan, espagnol, français, autres
Variantas:
occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus parallèles, Corpus de la parole
Authors:
Lo Congrès
Licéncia:
Licences variées
Formats:
Base de données interrogeable en ligne
Ligam cap a la ressorsa:
https://corpus.locongres.com/#1630
Médiathèque virtuelle avec beaucoup de contenu : expositions virtuelles, malettes pédagogiques, livres et textes anciens numérisés, vidéos documentaires, enregistrements audios
Lengas:
occitan, français, anglais
Variantas:
occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole, Corpus multimédia et multimodaux
Authors:
CIRDÒC-Institut occitan de cultura
Licéncia:
© CIRDÒC
Formats:
Formats divers
Ligam cap a la ressorsa:
http://occitanica.eu#1629
Corpus de textes occitans, dont certains avec leur enregistrement audio.
Lengas:
occitan, français
Variantas:
occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Didier Grange
Licéncia:
© Didier Grange
Formats:
Textes et enregistrements
Ligam cap a la ressorsa:
https://www.marraire.eu#1628
Textes de Roland Pécout avec fichiers audios et vidéos.
Lengas:
occitan, français
Variantas:
occitan provençal
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Roland Pécout, Maria-Joana Verny
Licéncia:
© Université Montpellier III
Formats:
Fichiers flash avec transcription
Ligam cap a la ressorsa:
http://www.univ-montp3.fr/uoh/pecout/#1627
Catalogue du fonds documentaire de Cordae / La Talvera, avec des documents audios et des vidéos, dont certains sont accessibles en ligne et d'autres en consultation sur place.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Association CORDAE La Talvera
Licéncia:
© CORDAE / La Talvera
Formats:
Catalogue de documents
Ligam cap a la ressorsa:
http://cordae-talvera-documentation.kentika.fr/#1626
Transcription des émissions d'information PantaInfo diffusée sur Ràdio Nissa Pantai.
Lengas:
occitan
Variantas:
occitan nissard
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Ràdio Nissa Pantai
Licéncia:
© Nissa Pantai
Formats:
Transcriptions des émissions
Ligam cap a la ressorsa:
http://pantainfo.overblog.com/#1625
Enregistrements audios de petits textes avec leur transcription, pour s'entraîner à la « Dictada occitana ».
Lengas:
occitan
Variantas:
occitan gascon, occitan languedocien, occitan limousin, occitan provençal
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Occitanica, Josiana Ubaud, Alan Roch, Joan Ganhaire, Danís Chapduèlh, Didier Tousis
Licéncia:
© CIRDÒC
Formats:
Enregistrements de petits textes
Ligam cap a la ressorsa:
https://occitanica.eu/items/show/3368#1624
Enregistrements audios d'albums pour les enfants en occitan gascon, languedocien et limousin.
Lengas:
occitan
Variantas:
occitan gascon, occitan languedocien, occitan limousin
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
CAP'ÒC
Licéncia:
© CDDP64, CRDP Bordèu
Formats:
Enregistrements d'albums pour enfants
Ligam cap a la ressorsa:
https://www.capoc.fr/articles.php?lng=fr&pg=176&mnuid=304&tconfig=0#1623
Récits en occitan, avec leur transcription et leur traduction en français, des notices d'information et des lexiques. Récits classés par variété.
Lengas:
occitan, français
Variantas:
occitan auvergnat, occitan languedocien, occitan vivaro
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Jean-Khalil Atallah, Cécile Bruneteau, Sylvain Bumat, Audrey Richaud
Licéncia:
Copyright
Formats:
Enregistrements de contes avec transcription et traduction
Ligam cap a la ressorsa:
http://www.recits-occitan.com/#1622
Enregistrements audios de livres.
Lengas:
occitan
Variantas:
occitan languedocien, occitan gascon
Subjèctes:
Corpus de textes monolingues, Corpus de la parole
Authors:
Licéncia:
© Letras d'Oc
Formats:
Livres papiers et CD
Ligam cap a la ressorsa:
https://www.letrasdoc.org/fr/rubriques/livres-audio/#1621
Fonds de collectages, pour certains avec leur transcription. Plusieurs heures d'archives (documents audios, vidéos, films, photographies ).
Lengas:
occitan, français
Variantas:
occitan limousin
Subjèctes:
Corpus de la parole, Corpus multimédia et multimodaux
Authors:
IEO Limousin
Licéncia:
© IEO Limousin
Formats:
Site web
Ligam cap a la ressorsa:
http://la-biaca.org/#1605
Corpus aligné de phrases avec leur transcription dans plusieurs langues du monde (l'occitan est en construction). Données recueillies grâce à l'outil en ligne Mozilla Common Voice.
Lengas:
occitan, français, catalan, espagnol, autres
Variantas:
occitan aranais
Subjèctes:
Corpus de la parole
Authors:
Licéncia:
CC
Formats:
Fichiers téléchargeables
Ligam cap a la ressorsa:
https://commonvoice.mozilla.org#1604
Derniers épisodes de l'émission D'aicí d'alai à télécharger.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de la parole
Authors:
Jean-Léonard Coudouel
Licéncia:
© Radio Totem
Formats:
Site web
Ligam cap a la ressorsa:
https://www.radiototem.net/programmes/d-aici-d-alai#1603
Poscasts des émissions de Ràdio Lenga d'Òc, la radio occitane héraultaise.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de la parole
Authors:
Licéncia:
© © Ràdio Lenga d'Òc
Formats:
Émissions à podcaster
Ligam cap a la ressorsa:
https://radiolengadoc.com/category/podcast/#1602
Podcasts des émissions diffusées sur La Pòrta d'Òc, l'ancien portail du CIRDÒC.
Lengas:
occitan
Variantas:
occitan languedocien
Subjèctes:
Corpus de la parole
Authors:
Licéncia:
© CIRDÒC
Formats:
Émissions à podcaster
Ligam cap a la ressorsa:
https://www.ivoox.com/podcast-porta-d-oc-escotar-lenga-d-oc_sq_f1224512_1.html#1601
10 épisodes d'un feuilleton radiophonique en occitan avec leur transcription et leur traduction française.
Lengas:
occitan, français
Variantas:
occitan languedocien
Subjèctes:
Corpus de la parole
Authors:
Licéncia:
© CIRDÒC / Gargamela-théâtre
Formats:
Site web
Ligam cap a la ressorsa:
http://occitanica.eu/omeka/items/show/368#1600