La seule base de connaissances sur laquelle l'occitan peut s'appuyer pour le moment est Wikidata, la base de connaissance libre et collaborative de la fondation Wikimedia. Elle compte quasiment 100 millions de concepts et ceux-ci peuvent avoir des labels en occitan.
Chose intéressante, Wikidata permet d'enregistrer des données lexicographiques. On peut y recenser des lexèmes qui peuvent ensuite être liés aux concepts qu'ils représentent. Le Congrès a ouvert un programme pour verser des lexèmes occitans dans Wikidata, qui pourront être liés à leurs concepts. Ainsi, Wikidata pourra être utilisée, par exemple, pour faire de l'analyse sémantique.