DiViTal vise à accroître la vitalité et la visibilité de l’alsacien, du corse, de l’occitan et du poitevin-saintongeais. Il se positionne à la croisée de la linguistique descriptive et de la linguistique de corpus. Son but principal est la constitution de ressources, en particulier de corpus textuels bruts et annotés.
Il a plusieurs objectifs :
- construire des corpus monolingues dans des genres proches ou transcrivant la langue orale
- développer des corpus annotés dans le cadre des « Universal Dependencies »
- Produire des descriptions complètes et actualisées et des formalisations linguistiques à partir des corpus
- Sensibiliser la communauté du TAL aux problématiques des langues non standardisées et à la nécessité de prendre en compte la variation dans les systèmes de TAL
- Partager et transférer les expériences et les outils entre les langues du projet et explorer les méthodes de transfert technologique
Y participent les laboratoires CLLE, FoReLLIS, LiLPa et LISA.