cedat logo cedat logo

What's new

Deep Learning: la precisione non deve spaventare l’essere umano

venerdì Novembre 26, 2021

Gli studiosi hanno dimostrato come, analizzando la realtà e applicando le tecniche di elaborazione dei dati, oggi si siano fatti passi avanti nelle tecniche di precisione legate alle tecnologie di apprendimento approfondito.

Qual è il ramo più profondo del Machine Learning? Gli studiosi della materia rispondono il Deep Learning, o apprendimento approfondito. Di cosa si tratta? Marvin Minsky, padre dell’Intelligenza artificiale e autore del libro ‘La società della mente’ (The Society of Mind), ha formulato la teoria secondo la quale una ‘società’ di minuscoli componenti non intelligenti, operando insieme, è in grado di formare una mente intelligente. Questa teoria si è in gran parte dimostrata vera: le tecniche che utilizziamo per connettere l’incredibile numero di piccole parti sono state scoperte attraverso un’infinita successione di prove ed errori, fino a realizzare la convergenza delle reti neurali, l’apprendimento automatico, il Deep Learning e l’elaborazione estesa dei dati.

Secondo Osservatori.net, con una quantità sufficiente di dati, “il sistema è in grado di apprendere la rappresentazione corretta e di risolvere problemi di apprendimento automatico senza la necessità di un pre-processamento dei dati, come invece avviene per le tecniche tradizionali di Machine Learning”. In altre parole, si espongono reti neurali artificiali a una mole di dati notevole affinché possano imparare a svolgere compiti e funzioni. Si tratta di una tecnica di apprendimento più sofisticata, automatica che insegna ai computer a svolgere una funzione naturale per l’essere umano, come per esempio imparare.

Tra i primi esempi che possiamo inquadrare come derivati di questa tecnologia ci sono le macchine a guida autonoma, che si devono fermare allo stop oppure durante il loro transito devono riconoscere gli ostacoli come, per esempio, un lampione o un pedone. Inoltre, come spiega MathWorksÈ il fattore chiave del controllo vocale in dispositivi quali telefoni cellulari, tablet, TV e altoparlanti vivavoce”.

Nel Deep Learning, un modello computerizzato impara a svolgere attività di classificazione direttamente da immagini, testo o suoni. I modelli di Deep Learning possono raggiungere una precisione che, talvolta, potrebbe superare le prestazioni dell’essere umano. È questa, dunque, una delle caratteristiche ‘principe’ del Deep Learning che, gli sviluppi nel corso degli anni, hanno permesso di arrivare a risultati importanti come, per esempio, la classificazione degli oggetti nelle immagini.

Entrando nel dettaglio degli ambiti applicativi, Osservatori.net ci dà una dettagliata fotografia. Oltre alla classificazione di immagini è possibile pensare alla traduzione in tempo reale, il cosiddetto video captioning; alla videosorveglianza, al riconoscimento facciale, fino alla diagnosi medica. E, proprio un esempio concreto e recente della bontà dell’utilizzo del Deep Learning in ottica di apprendimento, la fornisce un articolo pubblicato su arXiv ripreso da Internazionale. In particolare, alcuni informatici hanno usato l’intelligenza artificiale per individuare i tasselli mancanti nelle tavolette mesopotamiche. Un programma di Deep Learning addestrato a leggere 104 lingue diverse, anche semitiche, tra cui l’accadico dell’antica Mesopotamia, è stato messo alla prova con diecimila tavolette cuneiformi di argilla incise 4.500 anni fa. Il software ha trovato parole o parti di frasi mancanti con una precisione dell’89% e, in alcuni casi, ha anche ampliato le possibili interpretazioni dei testi.

Per quanto “tecnologicamente nuove” le tecniche di Deep Learning affondano le proprie radici nel passato, precisamente già negli anni ’80, ma solo negli ultimi dieci anni si è riusciti a dimostrare la loro utilità in un’ampia gamma di applicazioni. Cosa ha permesso di arrivare a questo risultato? I dati a disposizione sono aumentati notevolmente; lo sviluppo di sistemi di calcolo parallelo altamente performanti basati su GPU (Graphics Processing Unit) e l’ottimizzazione dei metodi di addestramento delle reti neurali.