La màger part dels otisses de basa del tractament automatic del lengatge per l'occitan son bastits o son a mand de l'èstre. Las òbras màger, per l'avendidor, son de los melhorar, de los espandir a totas las varietats, de los socializar e de los utilizar dins d'otisses novèls en los combinant o en los enriquissent.
Combinar los otisses
Per exemple, se ligam amassa la reconeissença vocala e la traduccion automatica, poiriam obténer un logicial de sostitolatge automatic (es un projècte del Congrès). En i brancant, en mai, la sintèsi vocala, se poiriá far un traductor simultanèu automatic. Per aquò far, calrà probablament melhorar la qualitat d'aqueles tres logicials, que las errors son exponencialas quand se branca un otís amb un autre.
Brancar un etiquetaire de varietat qualitadós abans un otís coma lo traductor automatic o la sintèsi vocala permetriá als que coneisson pas l'occitan, e que son pas capables d'indicar la varietat del contengut que vòlon traduire o sintetizar, d'utilizar aqueles otisses de faiçon mai eficaça.
Ajustar una etapa d'analisi morfosintaxica abans la sintetizacion de mots permetriá de gerir melhor d'unas excepcions de prononciacion, e ajustar un corrector ortografic abans un traductor ajudariá a traduire melhor de tèxtes amb de fautas.
Utilizar los otisses per la socializacion
Cal tanben pensar a sensibilizar la societat civila a totes los biaisses que los otisses de TAL ja bastits permeton de far la lenga mai visibla. Es lo cas, per exemple, de l'utilizacion dels traductors automatics per afichar una version occitana d'un site web revirat « a la volada ». Se pòdon imaginar de campanhas per far conéisser aquela possibilitat a las entrepresas e las collectivitats que trabalhan pas dins lo domeni de l'occitan, mas que son sensiblas a la lenga e la cultura.
Per çò qu'es de la sintèsi vocala, i auriá mantun biais de l'utilizar per assegurar una melhora visibilitat de l'occitan : l'integrar dins un GPS o dins lo transpòrts publics, per exemple, en fasent en parallèle un trabalh bèl a l'entorn de la toponimia e la microtoponimia.
Cal tanben crear mai d'otisses pels desvolopaires (modules pels sites web, API, bibliotècas per de lengatges de programacion...) que permeton de tornar utilizar mai aisidament los otisses TAL per fargar d'aplicacions e de sites web que los utilizan. Per exemple, de modules que reviran automaticament los articles de sites pels CMS màgers, o d'extensions de navigators que permeton a l'utilizator d'ausir lo contengut d'una pagina web occitana (coma o prepausa Votz).
Tornar utilizar las ressorsas...
Los còrpus e los lexics bastits per d'otisses de TAL devon pas èstre limitats a aquel domeni. Ara que son constituits, i a mantun biais de los tornar utilizar. D'interfàcias per consultar los còrpus son plan utilas pels lingüistas. Los còrpus parallèles pòdon alimentar d'otisses de memòrias de traduccion (que fan ganhar de temps als traductors professionals). E los lexics d'un traductor automatic, enriquits per que l'otís pòsca seguir l'actualitat, pòdon èstre en partida recuperats per fargar de lexics tematics.
... per melhorar los otisses e ne crear de novèls
Sovent, dins lo domeni del TAL, una mena de ressorsa servís a bastir mantun otís. Los lexics monolingües fargats per un traductor pòdon alimentar lo diccionari d'un clavièr predictiu o lo d'un corrector ortografic. Los enregistraments audio faits per crear la sintèsi vocala pòdon èstre integrats al còrpus de la paraula d'una reconeissença vocala. Aquela mutualizacion permet de ganhar mai en mai de temps a mesura qu'un grand nombre d'otisses son ja desvolopats.
A mai, los otisses ja bastits permeton de generar mai de ressorsas que pòdon èstre tornadas utilizar per melhorar los otisses existents. Per exemple, quand qualqu'un fa un sostitolatge automatic e lo corregís, crèa de material novèl de còrpus audio alinhat que poirà entraïnar una novèla version de la reconeissença vocala. Un bon OCR permet d'aver mai de contengut occitan numerizat per enriquesir los còrpus monolingües, que pòdon tanben èstre aumentats en recuperant los tèxtes someses a un traductor automatic o a una sintèsi vocala. Recuperar las traduccions de logicials revirats permet d'enriquir los còrpus parallèles. A mai los otisses seràn qualitadoses, a mai seràn utilizats e a mai aurem de contengut per los melhorar.
Lo TAL de deman
Per çò que pertòca lo tractament automatic del lengatge, la màger part dels otisses qu'èran primordials per la lenga son bastits. Los otisses de segond nivèl (generacion de tèxte, chatBots, classificacion de documents, analisi de sentiment) son pas forçadament totes pertinents per l'occitan, qu'a pas las meteissas problematicas que las lengas dotadas. D'unes otisses fòrça precioses per las lengas mai espandidas (coma l'analisi de l'opinion publica sus un òme politic, la recèrca de produits pròches dels que lo client a ja crompats, l'analisi d'un tèxte per lo classificar dins lo bon repertòri d'una entrepresa, l'utilizacion de chatBots en plaça d'un uman per un servici après-venta...) son pas forçadament d'enjòcs màgers per l'occitan.
En contra, a d'escomesas pròprias per las qualas lo TAL pòt portar de ressorsas preciosas, coma dins lo domeni de la formacion o de l'extraccion terminologica (extraire automaticament de vocabulari especific a partir de còrpus). La produccion de ressorsas novèlas mercés als otisses ja bastits serà plan utila per aqueles desvolopaments futurs.