Indire, sito ufficiale
Istituto Nazionale di Documentazione, Innovazione e Ricerca Educativa MIUR
immagine di contorno      Formazione separatore dei progetti      Documentazione separatore barra alta      Didattica separatore barra alta      Comunicazione separatore barra alta Europa
contorno tabella centrale
TAL

Gli attori del TAL

Le aziende che hanno sviluppato e commercializzato soluzioni software per il Trattamento Automatico del Linguaggio.

di Lorenzo Calistri
04 Novembre 2003

Foto dall' archivio DIA Immagini per la didattica - uno dei progetti Indire

Solo 1/1000 degli investimenti previsti per l’innovazione nell'ultima finanziaria è stato destinato alle ricerche nel campo delle tecnologie vocali.
Le aziende di settore, licenziatarie di tecnologie all’avanguardia su tutti i mercati, vendono all’estero per quasi i 3/4 del proprio fatturato. Tali tecnologie sono infatti molto ricercate in paesi come gli Stati Uniti, ma quasi del tutto ignorate nell’ambito nazionale.
Nonostante la situazione citata, lo scenario europeo degli attori impegnati nello sviluppo delle tecnologie per il TAL vede in ruolo dominante le aziende italiane. I competitors ormai sono stati quasi tutti acquisiti dalle major americane come nel caso della ScanSoft che, nell'ottobre del 2002, ha rilevato le unità aziendali Philips Speech Processing Telephony e Voice Control e la relativa proprietà intellettuale. Un operazione da 35,4 mln di dollari.


Il linguaggio scritto
cos'è?
In Italia vi sono numerosi istituti universitari e imprese private che si occupano di trattamento automatico della lingua italiana. Per esempio sono stati raggiunti risultati interessanti dalla società Expert System che è l'unica software house italiana che fornisce questo genere di tecnologie a Microsoft per le sue applicazioni. Tra i software che la società di Modena commercializza, ricordiamo "eFolder": categorizzatore istantaneo di testi, in particolare di articoli e notizie. La soluzione è particolarmente semplice: basta incollare il testo che si vuole categorizzare e cliccare un pulsante; il sistema, compiendo un'analisi semantica del testo, gli attribuisce una delle categorie concettuali precedentemente definite. Mentre "eConcept" è un sistema che consente di fare ricerche in un archivio di migliaia di articoli usando un'interfaccia che permette di creare facilmente criteri di ricerca complessi su concetti, lemmi e parole chiave (keyword).
Per approfondire la tecnologia del linguaggio sviluppata da Expert System chiamata "Cogito", si consulti la presentazione.


L'analisi semantica
cos'è?
Si avvale di software in grado di analizzare semanticamente la domanda dell'utente, espressa in linguaggio libero e di dare una risposta in linguaggio libero.
Per avere un'idea dei risultati che tali software garantiscono, si consiglia di visitare il sistema START (sistema di risposta a domande in linguaggio naturale). Ovviamente il sito, e la lingua utilizzata, è ll'inglese poiché il progetto è stato realizzato dal Computer Science and Artificial Language Laboratory di Cambridge (Laboratorio di intelligenza artificiale e scienze dell'informazione del Massachussetts Institute of Technology).
Per avere invece un quadro aggiornato sullo stato dell'arte della ricerca in questo ambito, suggeriamo il Corso online sul trattamento del linguaggio naturale a cura della Facoltà di Ingegneria dell'Università di Parma, realizzato da Dario Bianchi (bianchi@ce.unipr.it) docente di Ingegneria della Conoscenza e Sistemi esperti. 
Il corso può essere scaricato anche da qui: TalSuWEB.zip (250 kb)


Il linguaggio orale
cos'è?

  • riconoscimento vocale o del parlato
    I problemi maggiori derivano dai rumori ambientali che inquinano il segnale audio. Effettuando la chiamata all’interno di una cabina telefonica, isolata dall’ambiente circostante, o con un microfono di qualità si potrebbe arginare buona parte dei rumori di fondo, ma nei contesti reali di fruizione del servizio, il dialogo avviene con microfoni spesso non adatti e in contesti rumorosi. L’uso di cellulari ha espanso il problema consentendo di fare chiamate da qualsiasi luogo, anche in ambienti aperti.
    Per ovviare ai rumori ambientali ripetitivi (motore auto, fruscio) vengono utilizzati appositi filtri che eliminano o attenuano i rumori anche se quelli imprevedibili non sono gestibili dal sistema (altoparlante alla stazione, clacson etc.). Si tratta di un grosso problema non completamente risolvibile, almeno per il momento.
    Alcune demo di sistemi di riconoscimento del parlato sono disponibili sul sito della Loquendo, società di Telecom Italia con sede a Torino, uffici a Roma e Madrid ed attività in Europa, Nord e Sud America. La Loquendo ha realizzato applicazioni di livello nazionale ed internazionale che gestiscono automaticamente milioni di telefonate al giorno e si avvale di importanti partner commerciali.
     
  • riconoscimento del parlante
    Tecnologia che permette alla macchina - previo inserimento di parametri necessari quali il campione della voce e la decodifica del timbro vocale – di verificare l'identità di un individuo.
    Può essere utilizzato nell’ambito della sicurezza, per l'accesso a un luogo o a un servizio, come l'home banking, anche se, per meri motivi quali un semplice mal di gola, non ne può essere assicurato l'uso esclusivo per l'accesso al servizio bensì come integrazione e supporto.

La sintesi vocale cos'è?
Alcune demo di sistemi di sintesi vocale disponibili sul sito della Loquendo.

La traduzione automatica cos'è?
Per quanto riguarda la conversione dello scritto, invece, uno dei software in grado di tradurre automaticamente è "PeTra" (inglese-italiano-inglese). PeTra è un prodotto che Synthema ha sviluppato in collaborazione con IBM e che, grazie a tale collaborazione, permette a un semplice personal computer di fare traduzioni automatiche a un livello di accuratezza che finora erano prerogativa dei prototipi che funzionavano solo sui più grandi e potenti computer. Con Petra è quindi possibile tradurre automaticamente documenti integrali, mantenendone anche la struttura del testo originale (font, tabelle, immagini ecc.). Chi vuole può fare la prova di Petra direttamente scaricando la versione di prova.
Comunque sia, senza una successiva revisione umana, anche la traduzione automatica di PeTra è incompleta e presenta errori. Inoltre, alcune tipologie di testo (per esempio, letterario) contengono troppe ambiguità, metafore o espressioni simbolico-evocative che Petra, e i suoi algoritmi, non è in grado di decodificare. 

 

Lorenzo Calistri, redazione webzine [l.calistri@indire.it]
Silvia Panzavolta, Indire [s.panzavolta@indire.it]

L'immagine è tratta dall'archivio immagini DIA di Indire

 
Articoli correlati

TAL, a che punto siamo?
di Silvia Panzavolta (13 Giugno 2005)

TAL: stato dell'arte in Italia
di Lorenzo Calistri (19 Dicembre 2003)

Trattamento automatico del linguaggio e fantascienza
di Massimo Acciai (11 Novembre 2003)

Il trattamento del linguaggio naturale (TAL)
di Silvia Panzavolta (04 Novembre 2003)

Traduttori automatici gratuiti
di Silvia Panzavolta (01 Gennaio 2003)