Marianne Vergez-Couret est maîtresse de conférence en linguistique de corpus à l'Université de Poitiers. Elle a participé à la création de plusieurs ressources et plusieurs outils pour le TAL occitan.
Parmi les ressources pour la linguistique et le TAL, on peut citer la base de textes BaTelÒc, le lexique ouvert des formes fléchies Loflòc, des corpus annotés au niveau morphosyntaxique e syntaxique et des corpus oraux. Elle a participé au développement de Jochre, un outil d'OCR, de l'analyseur morphosyntaxique et syntaxique Talismane et d'un tokenizer.
Dans le cadre de ses différents emplois universitaires (entre autres au sein du laboratoire CLLE), elle a mené et participé à plusieurs projets de recherche : BaTelÒc, Restaure, Linguatec, et DIVITAL, projet 2022-2025 financé par l'Agence nationale de la recherche.
Ses domaines de compétence principaux sont :
- la constitution de corpus occitan (textuels et audios) et leur annotation
- la constitution de lexiques de formes fléchies
- l'analyse morphosyntaxique et la lemmatisation
- l'analyse syntaxique
- la tokenisation
Vous pouvez la trouver sur Linkedin.