with Corpus de la parole as subjècte

  • ReVoc Corpus

    Corpus audio aligné collaboratif créé dans le cadre de ReVoc, le projet de reconnaissance vocale occitane.

    occitan

    occitan auvergnat, occitan gascon, occitan languedocien, occitan limousin, occitan provençal, occitan aranais, occitan nissard

    Corpus de la parole

    Lo Congrès

    CC-BY

    Fichiers téléchargeables

    https://zenodo.org/records/11566430#1832

  • Còrpus, le multicorpus du Congrès

    Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.

    occitan, catalan, espagnol, français, autres

    occitan languedocien, occitan auvergnat, occitan provençal, occitan limousin, occitan vivaro

    Corpus de textes monolingues, Corpus parallèles, Corpus de la parole

    Lo Congrès

    Licences variées

    Base de données interrogeable en ligne

    https://corpus.locongres.com/#1630

  • Mozilla Common Voices

    Corpus aligné de phrases avec leur transcription dans plusieurs langues du monde (l'occitan est en construction). Données recueillies grâce à l'outil en ligne Mozilla Common Voice.

    occitan, français, catalan, espagnol, autres

    occitan aranais

    Corpus de la parole

    CC

    Fichiers téléchargeables

    https://commonvoice.mozilla.org#1604

  • Lingua Libre

    Bibliothèque d'enregistrements sonores (également reversée dans Wikimedia Commons) de mots, phrases, proverbes La transcription de l'audio est dans le nom du fichier.

    occitan

    occitan auvergnat, occitan languedocien, occitan provençal, occitan limousin, occitan vivaro

    Corpus de la parole

    Fondation Wikimedia, contributeurs

    CC-BY-SA

    Fichiers ZIP avec tous les enregistrements d'une langue (ou variété)

    https://lingualibre.org/datasets/#1588


Results 1 - 4 of 4