Les seuls lexiques bilingues libres formatés pour le traitement automatique de la langue sont ceux du traducteur automatique libre Apertium. Il en existe pour les paires occitan-français, occitan-catalan et occitan-espagnol.
Le Congrès, dans le cadre de son projet Lexics, est en train de formater tous les dictionnaires bilingues du Dicodòc en XML selon la norme TEI-P5. Pour le moment, il a traité 14 dictionnaires, 18 lexiques thématiques et 13 bases toponymiques.
Il existe d'autres lexiques bilingues et dictionnaires en ligne qui ne sont pas forcément pensés pour le traitement automatique de la langue, mais dont le format permettrait d'être facilement exploités dans cet objectif.