Clamença Poujade est doctorante à l'Université de Toulouse Jean Jaurès dans le laboratoire CLLE. Son travail porte sur l'annotation automatique de corpus écrits monolingues d'occitan moderne.
Elle se concentre particulièrement sur l'annotation automatique de la nature et de la flexion morphologique des mots. Elle s'intéresse aussi à la question de la lemmatisation automatique des textes.
Dans le cadre de ce travail de thèse, elle a pu construire des outils d'annotation automatique qui utilisent des vecteurs de mots et l'architecture de réseaux neuronaux. Elle essaie, avec cette thèse, d'améliorer les outils pour que la variation présente en occitan ne soit plus un problème pour le TAL, qu'il s'agisse de variation linguistique ou de variation graphique.
Ses domaines de compétence principaux sont :
- la constitution de corpus écrits monolingues et de corpus oraux
- l'annotation de la nature et la morphologie des mots dans des corpus écrits (manuellement ou automatiquement)
- l'utilisation d'outils de réseaux neuronaux et de vectorisation de mots
- la connaissance de la morphologie et de la flexion verbale
- le traitement automatique de la variation graphique et linguistique