Computer Vision: lo sguardo Artificiale sul mondo
L’intelligenza artificiale sta pervadendo il mondo in modo sempre più capillare e rumoroso, trasformando ogni giorno l’industria insieme a molti aspetti del nostro vivere quotidiano.
Al crescere di tale consapevolezza si intensifica la mia curiosità di scoprire le intelligenze umane che alimentano questo inarrestabile e quasi autocatalitico processo di innovazione mondiale. Scenari incredibili si aprono quando pensatori eclettici e ricchi di talento collaborano facendo convergere studi, esperienze e prospettive unici nel loro genere.
Fei-Fei Li
Una tra le menti più stupefacenti che ha contribuito in maniera fondante allo sviluppo del settore è Fei-Fei Li, una giovane donna dal curriculum stellare e con la missione di rendere l’intelligenza artificiale un percorso democratico. L’importanza di un pensiero olistico ed inclusivo nel campo dell’AI è stata enfatizzata da Fei-Fei-Li con queste parole:
“We all have a responsibility to make sure everyone – including companies, governments and researchers – develop AI with diversity in mind”
Professore associato di Computer Science a Standford e responsabile scientifico dello Standford Vision Lab, Li ha pubblicato più di 150 articoli scientifici di ingegneria informatica e neuroscienze su riviste prestigiose (e.g Nature, PNAS, Journal of Neuroscience). Inoltre, ha reso possibile la creazione di ImageNet, un dataset di 15 milioni di immagini, indispensabile agli ultimi sviluppi del Deep learning nell’ambito della visione artificiale.
ImageNet è organizzato secondo la gerarchia di WordNet, un vasto database lessicale della lingua Inglese. In WordNet, ogni concetto, possibilmente descritto da più di una parola o da frasi intere, è chiamato “synset” (set di sinonimi). In WordNet ci sono più di 100.000 synset e in ImageNet ciascun synset è illustrato da circa un migliaio di immagini etichettate. Il laboratorio di Standford punta a fare in modo che ImageNet offra decine di milioni di immagini classificate secondo la gerarchia semantica di WordNet così da creare, come precisa Fei-Fei Li, non un dataset che riflette le statistiche del web ma un’antologia in grado di organizzare il contenuto visivo dell’intero sapere umano.
I recenti sviluppi nell’approccio basato sul deep learning hanno permesso un avanzamento enorme nelle performance dei compiti di riconoscimento visivo. In questo, Fei-Fei Li ha istituito un fronte d’avanguardia per la visione artificiale rendendo possibile l’addestramento di reti neurali convolutive su ImageNet. Il laboratorio di Standford rappresenta un punto di riferimento ed è costantemente concentrato su nuove sfide, inclusa quella di comprendere e riprodurre la funzionalità dei circuiti neuronali che permettono alla visione umana di eseguire compiti di riconoscimento visivo complessi con velocità ed efficienza impressionanti. E’ proprio dal gruppo di ricerca di Standford che nel 2010 ha avuto inizio la Large Scale Visual Recognition Challenge, una competizione mondiale annuale sostenuta dalla collaborazione fra le Università del North Carolina, di Standford e del Michigan.
Il fine ultimo della sfida è quello di creare algoritmi che raggiungano un’accuratezza nel riconoscimento e nella classificazione delle immagini confrontabile o superiore a quella umana. Un obiettivo ambizioso ma non del tutto esaustivo se si considera che il fine dell’elaborazione umana degli input visivi non è solo riconoscere e classificare immagini ma anche interpretare il contesto ambientale a scopo predittivo. Tale capacità, frutto della complessa interazione delle aree cerebrali in risposta agli stimoli visivi, è infatti fondamentale per la nostra continua ed immediata percezione dello spazio e del tempo.
Ma nel percorso tracciato da Li c’è già la ricetta per raggiungere nuovi traguardi: menti “visionarie” e una contaminazione profonda tra neuroscienze ed intelligenza artificiale.