• Loflòc, lexique morphologique pour l'occitan

    Lexique morphologique de 680 000 entrées avec leur lemme et leur PoS qui suit les préconisation de l'Universal Dependencies.

    occitan

    occitan languedocien

    Lexiques flexionnels

    Marianne Vergez-Couret

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/10838802#1838

  • McCATMuS

    Corpus de textes manuscrits, imprimés et tapés à la machine avec leur transcription textuelle. Ces textes datent du 16e au 21e siècle et contiennent 118 000 lignes de textes en 7 langues.

    occitan, français, latin, italien, espagnol, autres

    Corpus OCR

    Alix Chagué

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/13788177#1837

  • Tokenization for Occitan (python)

    Tokenizer en python développé pour prendre en compte les spécificités de l'occitan gascon et de l'occitan languedocien.

    occitan

    occitan languedocien, occitan gascon

    Tokenizers

    Marianne Vergez-Couret

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/12515136#1835

  • translate_po_with_revirada.py

    Outil qui permet de traduire automatiquement un fichier .po entre le français et l'occitan en appelant l'API Revirada.

    occitan, français

    occitan languedocien, occitan gascon

    Outils pour webmasters

    Lo Congrès

    Fichiers téléchargeables

    https://github.com/locongres/miscellaneous/blob/main/README.md#1833

  • ReVoc Corpus

    Corpus audio aligné collaboratif créé dans le cadre de ReVoc, le projet de reconnaissance vocale occitane.

    occitan

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan nissard

    Corpus de la parole

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/11566430#1832

  • Lo Congrès websites Corpus

    Phrases alignées tirées des sites multilingues (français, occitan et parfois anglais) du Congrès

    occitan, français, anglais

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan cisalpin, occitan vivaro

    Corpus parallèles

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/12192029#1831

  • Dumps du traducteur MinT

    Phrases alignées des corpus servant à entraîner le traducteur automatique MinT.

    occitan, français, catalan

    Corpus parallèles

    Wikimedia Foundation

    Fichiers téléchargeables

    https://dumps.wikimedia.org/other/contenttranslation/#1830

  • Corpus du fonds Aran e l'UAB

    Textes en occitan aranais numérisés et disponibles à plusieurs formats (dont txt).

    occitan

    occitan aranais

    Corpus de textes monolingues

    ©

    Fichiers téléchargeables

    https://ddd.uab.cat/pub/honsaran/#1829

  • Guies de conversa universitària

    Lexique multilingue de phrases de la vie de tous les jours.

    occitan, catalan, français, espagnol, autres

    occitan aranais

    Lexiques bilingues

    ©

    Outil en ligne

    https://www.ub.edu/guia-conversa/index.php#1828

  • Diccionari der aranés

    Dictionnaire en ligne avec 10 800 entrées, des définitions, des exemples et des synonymes.

    occitan

    occitan aranais

    Lexiques monolingues

    © Institut d'Estudis Aranesi

    Outil en ligne

    https://www.diccionari.cat/diccionari-der-aranes##1827

  • Conjugador aranés

    Conjugueur en ligne pour l'occitan aranais.

    occitan

    occitan aranais

    Lexiques flexionnels

    ©

    Outil en ligne

    https://www.diccionariaranes.com/conjugador#1826

  • Corpus de contes traditionnels écrits occitans annotés avec PoS

    Corpus de 5 extraits de textes annotés manuellement avec les lemmes et les PoS, suivant la norme Grace.

    occitan

    occitan languedocien, occitan gascon

    Corpus textuels annotés

    Marianne Vergez-Couret

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/1456564#1818

  • MinT

    Traducteur automatique entraîné à partir du contenu des outils de Wikimedia, basé sur plusieurs modèles de langue.

    occitan, français, catalan, espagnol, autres

    occitan languedocien

    Traduction automatique, API (Application Programming Interface)

    Wikimedia Foundation

    Copyright avec réutilisation autorisée

    Fichiers téléchargeables, service en ligne, API

    https://translate.wmcloud.org/html#1817

  • SoftwaresOccitanTranslations corpus

    Corpus bilingue, corpus bivariété et corpus monolingue générés automatiquement en alignant les traductions de nombreux logiciels open source.

    occitan, français, catalan, espagnol, autres

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro

    Corpus parallèles, Corpus de textes monolingues, Corpus de textes bivariétés

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/8411351#1814

  • Occitan Corpus from Lo Congrès news

    Corpus au format csv, segmenté au niveau de la phrase, généré à partir des actualités publiées sur le site locongres.org.

    occitan, français

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan vivaro

    Corpus parallèles

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/8411197#1813

  • Universal Dependencies treebank

    Corpus textuel annoté morphosyntaxiquement et syntaxiquement pour plus de 100 langues, dont l'occitan.

    occitan, autres

    Corpus textuels annotés

    Daniel Zeman et al.

    CC

    Fichiers téléchargeables

    https://universaldependencies.org/#1812

  • Plaintext Wikipedia dump 2018

    Corpus des articles de nombreuses Wikipedia (dont l'occitane) en 2018 formatés en plein texte.

    occitan, autres

    Corpus de textes monolingues

    Rudolf Rosa

    CC-BY-SA

    Fichiers téléchargeables

    https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2735#1809

  • Leipzig Corpora Collection

    Corpus tiré de Wikipèdia et du moissonnage de site web, que l'on peut télécharger ou explorer pour afficher les mots proches. L'occitan y est représenté.

    occitan, autres

    Corpus de textes monolingues

    Université de Leipzig

    CC-BY-NC

    Fichiers téléchargeables

    https://corpora.wortschatz-leipzig.de/#1808

  • OcWikiAnnot: Annotated Wikipedia Corpus of Occitan

    Corpus tiré de Wikipèdia, annoté en POS et lemmatisé.

    occitan

    Corpus textuels annotés

    Miletic, Aleksandra

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/record/7777340#1807

  • OSCAR (Open Super-large Crawled Aggregated coRpus)

    Corpus moissonné sur le web pour de nombreuses langues, dont l'occitan.

    occitan, autres

    Corpus de textes monolingues

    Inria, PRAIRIE Institute

    CC0

    Fichiers téléchargeables

    https://oscar-project.org/#1806


Results 1 - 20 of 106