avec Corpus de textes monolingues comme Sujet

  • Corpus du fonds Aran e l'UAB

    Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).

    occitan

    occitan aranais

    Corpus de textes monolingues

    ©

    Fichiers téléchargeables

    https://ddd.uab.cat/pub/honsaran/#1829

  • SoftwaresOccitanTranslations corpus

    Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.

    occitan, français, catalan, espagnol, autres

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro

    Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/8411351#1814

  • W2C – Web to Corpus – Corpora

    Corpus textuel réalisé automatiquement en moissonnant le web et la Wikipédia, pour de nombreuses langues dont l'occitan.

    occitan, autres

    Corpus de textes monolingues

    Martin Majliš

    CC-BY-SA

    Fichiers téléchargeables

    https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0022-6133-9#1811

  • Plaintext Wikipedia dump 2018

    Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.

    occitan, autres

    Corpus de textes monolingues

    Rudolf Rosa

    CC-BY-SA

    Fichiers téléchargeables

    https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809

  • Leipzig Corpora Collection

    Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.

    occitan, autres

    Corpus de textes monolingues

    Université de Leipzig

    CC-BY-NC

    Fichiers téléchargeables

    https://corpora.wortschatz-leipzig.de/#1808

  • OSCAR (Open Super-large Crawled Aggregated coRpus)

    Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.

    occitan, autres

    Corpus de textes monolingues

    Inria, PRAIRIE Institute

    CC0

    Fichiers téléchargeables

    https://oscar-project.org/#1806

  • OcWikiDisc

    Corpus généré à partir des pages de discussion de la Wikipèdia en occitan.

    occitan

    Corpus de textes monolingues

    Academy of Finland

    CC-BY-SA

    Fichiers téléchargeables

    https://zenodo.org/record/7079580#.Y2urH76ZNhF#1632

  • Jornalet

    Journal en ligne d'informations en occitan.

    occitan

    occitan languedocien, occitan gascon, occitan provençal

    Corpus de textes monolingues, Corpus multimédia et multimodaux

    Rédacteur en chef : Ferriòl Macip.

    CC-BY-SA, Copyright

    Site web

    http://www.jornalet.com/#1631

  • Còrpus, le multicorpus du Congrès

    Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.

    occitan, catalan, espagnol, français, autres

    occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro

    Corpus de textes monolingues, Corpus parallèles, Corpus de la parole

    Lo Congrès

    Licences variées

    Base de données interrogeable en ligne

    https://corpus.locongres.com/#1630

  • Occitanica

    Médiathèque virtuelle avec beaucoup de contenu : expositions virtuelles, malettes pédagogiques, livres et textes anciens numérisés, vidéos documentaires, enregistrements audios

    occitan, français, anglais

    occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro

    Corpus de textes monolingues, Corpus de la parole, Corpus multimédia et multimodaux

    CIRDÒC-Institut occitan de cultura

    © CIRDÒC

    Formats divers

    http://occitanica.eu#1629

  • Paraulas de tèrras occitanas

    Corpus de textes occitans, dont certains avec leur enregistrement audio.

    occitan, français

    occitan vivaro

    Corpus de textes monolingues, Corpus de la parole

    Didier Grange

    © Didier Grange

    Textes et enregistrements

    https://www.marraire.eu#1628

  • Corpus de textes de Roland Pécout

    Textes de Roland Pécout avec fichiers audios et vidéos.

    occitan, français

    occitan provençal

    Corpus de textes monolingues, Corpus de la parole

    Roland Pécout, Maria-Joana Verny

    © Université Montpellier III

    Fichiers flash avec transcription

    http://www.univ-montp3.fr/uoh/pecout/#1627

  • Catalogue de l'association CORDAE / La Talvera

    Catalogue du fonds documentaire de Cordae / La Talvera, avec des documents audios et des vidéos, dont certains sont accessibles en ligne et d'autres en consultation sur place.

    occitan

    occitan languedocien

    Corpus de textes monolingues, Corpus de la parole

    Association CORDAE La Talvera

    © CORDAE / La Talvera

    Catalogue de documents

    http://cordae-talvera-documentation.kentika.fr/#1626

  • PantaInfo, l'émission d'actualité hebdomadaire de Ràdio Nissa Pantai

    Transcription des émissions d'information PantaInfo diffusée sur Ràdio Nissa Pantai.

    occitan

    occitan nissard

    Corpus de textes monolingues, Corpus de la parole

    Ràdio Nissa Pantai

    © Nissa Pantai

    Transcriptions des émissions

    http://pantainfo.overblog.com/#1625

  • Labo de lenga d'Occitanica : Entraïnament a la Dictada

    Enregistrements audios de petits textes avec leur transcription, pour s'entraîner à la « Dictada occitana ».

    occitan

    occitan gascon, occitan languedocien, occitan limousin, occitan provençal

    Corpus de textes monolingues, Corpus de la parole

    Occitanica, Josiana Ubaud, Alan Roch, Joan Ganhaire, Danís Chapduèlh, Didier Tousis

    © CIRDÒC

    Enregistrements de petits textes

    https://occitanica.eu/items/show/3368#1624

  • Albums à écouter du CAP'ÒC

    Enregistrements audios d'albums pour les enfants en occitan gascon, languedocien et limousin.

    occitan

    occitan gascon, occitan languedocien, occitan limousin

    Corpus de textes monolingues, Corpus de la parole

    CAP'ÒC

    © CDDP64, CRDP Bordèu

    Enregistrements d'albums pour enfants

    https://www.capoc.fr/articles.php?lng=fr&pg=176&mnuid=304&tconfig=0#1623

  • Recueil de Contes, Légendes et Autres Récits d'Auvergne

    Récits en occitan, avec leur transcription et leur traduction en français, des notices d'information et des lexiques. Récits classés par variété.

    occitan, français

    occitan auvergnat, occitan languedocien, occitan vivaro

    Corpus de textes monolingues, Corpus de la parole

    Jean-Khalil Atallah, Cécile Bruneteau, Sylvain Bumat, Audrey Richaud

    Copyright

    Enregistrements de contes avec transcription et traduction

    http://www.recits-occitan.com/#1622

  • Livres audios de Letras d'Òc

    Enregistrements audios de livres.

    occitan

    occitan languedocien, occitan gascon

    Corpus de textes monolingues, Corpus de la parole

    © Letras d'Oc

    Livres papiers et CD

    https://www.letrasdoc.org/fr/rubriques/livres-audio/#1621

  • Mémoires de traduction

    Corpus de phrases tirées de traductions de logiciels en occitan.

    occitan

    occitan languedocien

    Corpus de textes monolingues

    Quentin Pagès

    CC-BY-SA

    Fichiers TMX

    https://www.mejans.fr/article/memoria-de-traduccion.html#1620

  • Paraulas en Oc

    Portail avec des milliers de paroles de chansons en occitan et dans d'autres langues.

    occitan

    Corpus de textes monolingues

    Aure Séguier

    Licences variées

    Pages HTML

    http://www.paraulas.net#1619


Résultats 1 - 20 de 33