cedat logo cedat logo

What's new

Machine Translation: un’utopia diventata realtà.

Dicembre 20, 2021

“Величина угла определяется отношением длины дуги к радиусу” – “Magnitude of angle is determined by the relation of length of arc to radius.”

L’ampiezza dell’angolo è determinata dalla relazione tra la lunghezza dell’arco e il raggio.

È qui, da questa frase, che inizia, nel 1954, la storia moderna della machine translation o, per usare la nostra lingua, dei sistemi di traduzione automatica.
Una storia moderna, perché cercando nei libri di storia si trovano riferimenti a studi e progetti mirati a sviluppare sistemi che consentissero di tradurre in modo automatico testi o discorsi da una lingua naturale all’altra risalenti al secolo IX, al secolo XVII e via via nel tempo fino ai primi Anni Trenta.
Ma è negli Anni Cinquanta che questi progetti prendono realmente forma e concretezza.
Ed è nel 1954 che si realizza l’esperimento noto come Georgetown-IBM, con il quale si realizzò una traduzione completamente automatica di una sessantina di frasi russe in inglese. Un esperimento il cui successo convinse della necessità di proseguire con gli studi e gli investimenti non solo negli Stati Uniti ma in tutto il mondo.
Cosa che puntualmente avvenne, con alterne fortune, nei decenni successivi.
Il grande scoglio da superare era quello di riuscire a dimostrare che la traduzione automatica potesse essere più veloce e altrettanto efficace e accurata rispetto a una traduzione svolta da un traduttore umano.
Non è un caso che per vedere risultati convincenti si debba aspettare la fine degli Anni Ottanta e da lì via via fino a giorni nostri.
Il grande scoglio da superare si chiamava, infatti, potenza computazionale.
E fino all’ultimo decennio del secolo scorso non ve ne era a sufficienza per poter ottenere i risultati sperati.

Come già accennato, con Machine Translation o Traduzione Automatica si intende la traduzione di un testo scritto o parlato – in questo ultimo caso spesso in collaborazione con un sistema di trascrizione automatica –  da una lingua a un’altra tramite un software in grado di processare rapidamente grandi volumi di testo, a una velocità decisamente superiore alla capacità umana, in una grande quantità di lingue di origine e di destinazione.
La traduzione automatica funziona su dati di addestramento, sia generici, sia personalizzati a seconda di specifiche esigenze settoriali, di dominio o di contesto.
In genere si fa riferimento a tre diverse tipologie e metodologie di traduzione automatica.
In primo luogo abbiamo la traduzione automatica rule-based, basata su regole, che utilizza regole grammaticali e linguistiche, sviluppate da esperti linguistici, e dizionari che possono essere personalizzati per un argomento o un settore specifico.
Una seconda metodologia è di tipo statistico. In questo caso, la base di partenza non è rappresentata da regole e parole linguistiche, bensì l’analisi di una grande quantità di traduzioni umane già esistenti, che vanno dunque a costituire una “knowledge base” di conoscenze e ricorrenze.
Fino a cinque anni fa, la grande maggioranza delle soluzioni di traduzione automatica disponibili sul mercato si basavano su algoritmi e metodi statistici: con la Statistical Machine Translation si effettua un’analisi statistica avanzata per valutare le migliori traduzioni possibili per una parola, in relazione alle agli altri termini presenti nella frase.
La terza metodologia, che si sta affermando in questi ultimi anni, fa invece riferimento alle reti neurali. In questo caso si parla di Neural Machine Translation (NMT), termine con cui si intende un approccio basato su reti neurali profonde e su due componenti chiave: un codificatore che legge la frase di input e genera una rappresentazione adatta alla traduzione e un decodificatore che genera la traduzione effettiva. Le parole e le frasi sono rappresentate come vettori di numeri reali. È una metodologia sulla quale si stanno concentrando gli sforzi dal momento che i risultati generati tendono ad essere migliori, grammaticalmente precisi e più fluenti.
Di fatto, le reti neurali colgono meglio il contesto di frasi complete prima di tradurle.

A volte le tecniche di trascrizione e traduzione sono strettamente collegate per cui il risultato di una buona trascrizione automatica alimenta un processo di Machine Translation con un flusso automatico e continuo, questo ad esempio è il processo adottato dal Parlamento Europeo per la trascrizione e traduzione in tempo reale della sessioni plenarie in 24 lingue.