Fei-Fei Li, riconosciuta come la "madrina dell'IA", ha chiuso un round di finanziamento di 1 miliardo di dollari per World Labs, la sua startup focalizzata nel dotare le macchine della capacità di comprendere il mondo in tre dimensioni. Tra gli investitori spiccano giganti come NVIDIA, AMD, Autodesk e il fondo Andreessen Horowitz. Li, come altri leader nell'intelligenza artificiale, sostiene che il futuro dell'IA dipende dai modelli di mondo, piuttosto che dalla ricerca dell'intelligenza artificiale generale (AGI).
Chi è Fei-Fei Li e perché è rilevante? Li è stata fondamentale nello sviluppo di ImageNet, il database di immagini che ha rivoluzionato l'apprendimento profondo e ha gettato le basi per l'IA generativa attuale. Il suo lavoro ha permesso ai computer di imparare a identificare oggetti nelle immagini, promuovendo progressi che oggi si riflettono in assistenti vocali e modelli generativi di testo e immagine.
Dall'Università di Stanford, dove dirige l'Istituto di IA Centrata sull'Umano, e da World Labs, fondata nel 2024, Li affronta una nuova sfida: far sì che le macchine comprendano il mondo fisico, oltre il testo o le immagini piatte.
La sfida da risolvere. I grandi modelli di linguaggio come GPT o Claude hanno dimostrato una enorme capacità di elaborare testo, ma il mondo reale è tridimensionale, con fisica e geometria, ed è pieno di oggetti che interagiscono. "Affinché l'IA sia realmente utile, deve comprendere mondi, non solo parole", ha affermato Li nel suo comunicato.
World Labs punta sull'intelligenza spaziale, sviluppando modelli capaci di percepire, generare e interagire con ambienti 3D. L'obiettivo è che l'IA possa ragionare sullo spazio: identificare la posizione di un oggetto, anticipare movimenti, comprendere relazioni spaziali e prevedere conseguenze delle azioni in un ambiente.
Progressi e prossimi passi. Lo scorso novembre, World Labs ha presentato Marble, il suo primo prodotto commerciale: un modello capace di generare ambienti 3D editabili a partire da testo, immagini, video o panorami. Gli utenti possono creare, modificare ed esportare mondi virtuali, risultando particolarmente utile nei videogiochi, effetti visivi, realtà virtuale e settori con alta domanda di contenuti 3D.
Con il nuovo finanziamento, World Labs amplierà il suo focus verso la robotica, dove l'intelligenza spaziale è essenziale. Un robot che comprende il suo ambiente può pianificare, adattarsi ed eseguire compiti in scenari in cambiamento senza necessità di costante riprogrammazione.
Autodesk, che ha investito 200 milioni di dollari, vede un'opportunità chiara: il suo software di design è fondamentale per architetti, ingegneri e creatori di contenuti 3D. La collaborazione permetterà di integrare i modelli generativi di World Labs nei flussi di lavoro di Autodesk, facilitando la creazione e manipolazione di ambienti virtuali. Secondo Daron Green, scienziato capo di Autodesk, la sinergia iniziale si concentrerà su intrattenimento e produzione audiovisiva, permettendo agli utenti di combinare oggetti progettati in Autodesk con mondi generati dall'IA.
Competizione nel settore. World Labs non è l'unica azienda che punta sui modelli di mondo. Google DeepMind sviluppa la famiglia di modelli Genie, mentre Yann LeCun, ex capo dell'IA in Meta, ha fondato AMI Labs con un approccio simile. Altre startup come Decart e Odyssey stanno esplorando questo campo, sebbene siano ancora in fasi iniziali.
Ogni attore ha la propria visione: LeCun sostiene la necessità di un'architettura di IA completamente nuova per creare modelli di mondo, mentre Li punta a evolvere i modelli generativi attuali e perfezionarli progressivamente.