Convegno a Roma per discutere di TAL, focus sull’industria delle lingue con Nicoletta Calzolari (ILC-CNR)

di di R&D Expert Group (Comm.Ue) |

a cura della Redazione

INTERVISTA


Nicoletta Calzolari

Abbiamo intervistato Nicoletta Calzolari, direttore dell’Istituto di Linguistica Computazionale (ILC) del CNR di Pisa. Questo Istituto ha una chiara leadership nazionale e internazionale, promuovendo la cooperazione con le maggiori iniziative relative alle Risorse e Tecnologie Linguistiche (Language Resources and Technologies). Particolare attenzione viene data a inserire la lingua italiana in una rete internazionale multilingue. Le sue attività coprono tematiche di definizione di standard internazionali, di costruzione di risorse linguistiche computazionali, di sviluppo di modelli e metodi per l’elaborazione del linguaggio naturale mono- e multi-lingue e di metodi e strumenti per la ricerca umanistica.

In occasione della presentazione del Convegno internazionale sulle tecnologie della lingua, Langtech (28-29 febbraio 2008 presso il San Michele a Ripa Convention Center a Roma), le abbiamo rivolto qualche domanda sul tema.

 

K4B.   Cosa si intende con l’acronimo TAL?

 

Calzolari. Il TAL (Trattamento Automatico della Lingua) designa un settore tipicamente interdisciplinare che si occupa di modelli, metodi, risorse, tecnologie, sistemi, applicazioni relativi all’elaborazione automatica della lingua, sia parlata sia scritta, e si pone obiettivi quali l’interazione vocale uomo-computer e la comprensione del linguaggio umano per servizi come la traduzione automatica e il reperimento di informazioni.

 

K4B.   Quali applicazioni di questa tecnologia e in che tempi?

 

Calzolari. Sappiamo che una delle priorità a livello europeo è “costruire una società basata sull’informazione e sulla conoscenza” e la lingua è veicolo e chiave di accesso principale alla conoscenza. Le più disparate categorie di utenti – dai professionisti o gli amministratori pubblici ai comuni cittadini o gli studenti – si confrontano quotidianamente con la necessità di accedere a grandi quantità di documenti digitali – in linguaggio naturale e in lingue diverse – disponibili sul Web.

Se noi codifichiamo e comunichiamo la conoscenza e i contenuti principalmente attraverso la lingua, gli strumenti del TAL, attraverso l’analisi linguistica automatica del testo, devono penetrare nella complessità della lingua umana per decodificare e rendere espliciti quei nuclei di conoscenza che possono soddisfare i bisogni informativi degli utenti. Non dimentichiamo che la lingua è anche mezzo privilegiato per le interazioni attraverso cui si svolgono le attività sociali, economiche, culturali.

 

K4B.   Cosa permette di fare il TAL?

 

Calzolari. Il TAL ci consente di estrarre informazioni rilevanti da testi (Information Extraction) anche in lingue diverse (Crosslingual Information Retrieval), acquisire dinamicamente nuovi elementi di conoscenza su un certo dominio (Text Mining), gestire e organizzare il materiale documentario  migliorando i processi di condivisione delle conoscenze, tradurre automaticamente testi, riassumerli, produrre e riconoscere il parlato. Ora si parla anche di riconoscimento automatico delle “emozioni” e  delle “opinioni”: è chiaro che le potenzialità applicative sono enormi.

L’industria delle lingue, ingegnerizzando i metodi e gli strumenti messi a punto dal TAL, li trasforma in prodotti utilizzabili in applicazioni e servizi concreti. Ricordo che il TAL viene definito “tecnologia orizzontale” o “pervasiva”, in quanto le sue applicazioni trovano utilizzo nei settori più svariati, da medicina a eGovernment, domotica, robotica, intelligence, insegnamento delle lingue, lessicografia, bioinformatica, sicurezza.

 

K4B.   Qual è lo stato dell’arte?

 

Calzolari. Gli sviluppi più recenti del TAL hanno creato soluzioni tecnologiche dalle enormi potenzialità, ad esempio per migliorare la ricerca e gestione intelligente dell’informazione contenuta nei documenti testuali. Il problema di come acquisire e gestire la conoscenza depositata nei documenti testuali dipende dal suo essere codificata all’interno della rete di strutture e relazioni grammaticali e lessicali che costituiscono la natura stessa della comunicazione linguistica.

L’interesse della Commissione Europea per le tecnologie linguistiche si è accentuato negli ultimi anni, anche per l’ingresso nell’Unione di nuovi membri e delle rispettive lingue. A livello europeo abbiamo anche nuove iniziative – di natura strategica – per promuovere lo sviluppo e il potenziamento del TAL e realizzare la necessaria infrastruttura di tecnologie e risorse linguistiche. Tali risorse però, per poter essere utilizzate nello sviluppo di prodotti e servizi, devono essere sviluppate, per ciascuna lingua, a carico del rispettivo paese.

Molti stati hanno riconosciuto che è necessario un supporto nazionale all’informatizzazione del trattamento delle rispettive lingue nazionali, per proteggere la competitività delle industrie e i diritti dei cittadini. Per fare solo un esempio, in Germania e in Francia si stanno finanziando ingenti progetti per il reperimento di informazioni in rete, di cui si parlerà nella Conferenza.

 

K4B.   In particolare qual è la situazione italiana in questo campo?

 

Calzolari. Abbiamo in Italia numerosi gruppi, accademici e industriali, che affrontano i diversi aspetti del settore, a volte in collaborazione, spesso – purtroppo, ma inevitabilmente – in competizione per finanziamenti nazionali o europei.

La promozione del trattamento automatico dell’italiano non può avvenire che in modo coordinato con quello delle altre lingue europee, per garantire la interoperabilità e la connettività nella rete globale.

L’Italia deve essere presente, con investimenti di Ricerca e Sviluppo e anche con investimenti di tipo Infrastrutturale, anche in questo settore della ricerca, se non vogliamo disperdere i risultati conseguiti finora e le posizioni di eccellenza che molti di noi hanno guadagnato nel settore. In mancanza di investimenti adeguati si rischia di perdere la competitività in campo europeo o internazionale, penalizzando soprattutto le PMI. All’Italia manca una programma di ricerca nazionale del settore, coordinato con i programmi Europei. Istituti come il nostro o organismi come il Forum TAL sono costretti a supplire a questa mancanza.

 

K4B.   Quali gli obiettivi di LangTech 2008?

 

Calzolari. LangTech si rivolge soprattutto all’industria, al mercato, al business, e si propone di mostrare le potenzialità, e le realtà, del TAL da questo punto di vista. Ci saranno sessioni con interventi sui settori applicativi più caldi, come le applicazioni del riconoscimento del parlato, i metodi di trascrizione del parlato, la  traduzione automatica, l’intelligence, la ricerca “intelligente” di informazioni in rete, il “customer relationship management”, il trattamento della conoscenza. Ma altrettanto o più importante sarà lo spazio espositivo, dove gruppi industriali o accademici, italiani e stranieri, mostreranno i loro prodotti e applicazioni.

Spero si percepiranno chiaramente le prospettive aperte dal TAL, sia di sfruttamento economico sia di miglioramento dei servizi per i cittadini.