-
ReVoc Corpus
Corpus audio aligné collaboratif créé dans le cadre de ReVoc, le projet de reconnaissance vocale occitane.
-
Còrpus, le multicorpus du Congrès
Corpus monolingue, bilingue et audio constitué par le Congrès dans un but de réalisation d'outils TAL.
-
Mozilla Common Voices
Corpus aligné de phrases avec leur transcription dans plusieurs langues du monde (l'occitan est en construction). Données recueillies grâce à l'outil en ligne Mozilla Common Voice.
-
Lingua Libre
Bibliothèque d'enregistrements sonores (également reversée dans Wikimedia Commons) de mots, phrases, proverbes La transcription de l'audio est dans le nom du fichier.