Nel 2019, il ricercatore François Chollet propose un benchmark innovativo per l'intelligenza artificiale: ARC-AGI. All'epoca, l'idea sembrava anticipata rispetto ai tempi, poiché non esistevano ancora modelli in grado di affrontare quel tipo di prove. Chollet previde l'ascesa dell'IA, che sarebbe arrivata anni dopo con l'emergere di ChatGPT e il conseguente boom del settore. Col tempo sono emersi numerosi benchmark sintetici per valutare le prestazioni dei modelli di IA, ma ARC-AGI si differenziava per il suo approccio: invece di misurare la capacità di memorizzazione, metteva alla prova il pensiero astratto e la generalizzazione. Le sfide di ARC-AGI e della sua versione successiva, ARC-AGI 2, consistono in puzzle visivi che risultano semplici per gli esseri umani, ma che tradizionalmente sono stati un ostacolo per le macchine. Tuttavia, negli ultimi due anni, i modelli di IA hanno fatto notevoli progressi in queste aree, risolvendo sempre più problemi di ARC-AGI. Nel 2024, il modello o3-preview è riuscito a risolvere l'87% di ARC-AGI 1, un risultato che gli stessi creatori del benchmark hanno evidenziato pubblicamente. Tuttavia, il costo è stato elevato: 456.000 dollari per 100 compiti, ovvero 4.560 dollari per compito. Ieri, OpenAI ha presentato GPT-5.2, il suo modello più recente. Sebbene le sue prestazioni in altri benchmark fossero già eccezionali, ciò che ha colpito di più è stata la sua performance in ARC-AGI 1: GPT-5.2 Pro (X-High) ha risolto il 90,5% dei problemi, ma ciò che è stato davvero rivoluzionario è stato il costo, ridotto a soli 11,65 dollari per compito, 390 volte meno rispetto all'anno precedente. Anche una versione più economica, GPT-5.2 (X-High), ha raggiunto un 86,2% di successi per appena 0,96 dollari per compito. Anticipando il progresso dell'IA, Chollet e il suo team hanno lanciato a marzo 2025 ARC-AGI 2, una versione ancora più impegnativa. Fino ad ora, il miglior risultato era stato ottenuto da Claude Opus 4.5, risolvendo solo il 38% dei problemi. GPT-5.2 ha fatto un salto significativo, raggiungendo quasi il 55% di successi, mantenendo un costo di 15,72 dollari per compito. La tendenza è chiara: l'IA non solo migliora in capacità, ma diventa anche molto più accessibile economicamente. Questo è particolarmente rilevante in un contesto in cui la scalabilità dei modelli non produce più salti così spettacolari nelle prestazioni, ma sì in efficienza e costo. L'industria dell'IA sembra essere a un punto di svolta. La questione non è più se l'IA sarà in grado di risolvere un problema, ma quanto costerà farlo. GPT-5.2 dimostra che è possibile progredire in entrambi i fronti: maggiore capacità e minore costo, un fattore cruciale per OpenAI in un momento di sfide economiche. Inoltre, questo progresso rappresenta una risposta diretta alla concorrenza, come Gemini 3 Pro, e segna la strada verso un'IA più efficiente e accessibile.

Gialoma

GPT 5.2: L'innovazione che riduce i costi o solo un ulteriore miglioramento?

Paloma Firgaira

Articoli Recenti

IA che rivoluziona l'efficienza nei consumi e nei processi industriali | El Diario Montañés

Amazon promuove la sua leadership con una strategia innovativa basata sull'intelligenza artificiale.

Innovazione quantistica in Spagna: tecnologia applicata al mondo imprenditoriale

Categorie Popolari