Alibaba ha sorpreso il mondo dell'intelligenza artificiale con il lancio di Qwen3.6-27B, un modello di linguaggio aperto che ridefinisce le aspettative sui modelli compatti. Fino ad ora, l'azienda si era distinta per Qwen3.5-397B-A17B, un modello colossale con 397 miliardi di parametri e un peso di 807 GB, rendendolo poco accessibile per la maggior parte degli utenti. Tuttavia, il nuovo Qwen3.6-27B, nella sua versione quantizzata, riduce drasticamente le dimensioni a meno di 17 GB, senza sacrificare le prestazioni. A differenza della tendenza attuale verso architetture Mixture-of-Experts (MoE), dove solo una parte dei parametri viene attivata in ogni inferenza, Qwen3.6-27B è un modello denso: utilizza i suoi 27 miliardi di parametri in ogni operazione. Questo semplifica il suo utilizzo, elimina la necessità di configurare percorsi di esperti e consente una quantizzazione più efficiente e prevedibile. I risultati avvalorano questa scelta. In test come SWE-bench Verified, riferimento per compiti di programmazione, Qwen3.6-27B raggiunge il 77,2%, superando il modello da 397B, che ottiene il 76,2%. In Terminal-Bench 2.0, orientato a compiti in console, il nuovo modello ottiene il 59,3%, rispetto al 2,5% del suo predecessore, e pareggia persino con Claude Opus 4.5 di Anthropic, uno dei modelli commerciali più avanzati. Anche se questi dati provengono da Alibaba e manca ancora una verifica indipendente, le prime impressioni della comunità sono molto positive. Il team di Alibaba ha sottolineato le prestazioni di Qwen3.6-27B, posizionandolo al di sopra del suo precedente modello di punta. Questo riconoscimento interno sottolinea un cambiamento di paradigma: i modelli più piccoli possono competere, e persino superare, i giganti in compiti specifici. Un altro vantaggio chiave è la sua accessibilità. Con solo 24 GB di VRAM, schede come la RTX 3090 possono eseguire Qwen3.6-27B localmente con grande efficienza, qualcosa di impensabile con modelli più grandi. Anche se i modelli densi non rendono allo stesso modo su dispositivi con memoria unificata come i MacBook, la possibilità di eseguire IA avanzata su hardware relativamente accessibile è un notevole progresso. Alibaba aveva già mostrato il suo impegno per modelli compatti con lanci recenti di SLM tra 0,8B e 9B di parametri. Il mercato dei modelli piccoli si sta dinamizzando, con alternative come Gemma 4 di Google, Phi-4 di Microsoft o Devstral 2 di Mistral, dimostrando che la concorrenza arriva anche dall'Occidente. Nonostante le sue impressionanti prestazioni, Qwen3.6-27B conferma che i modelli cinesi open source sono ancora, secondo esperti come Demis Hassabis, tra 6 e 12 mesi indietro rispetto ai leader di Anthropic, OpenAI o Google. Inoltre, eseguire questi modelli localmente richiede un investimento considerevole in hardware. Per chi cerca la massima velocità ed efficienza, i servizi commerciali in cloud rimangono l'opzione preferita, anche se l'IA locale guadagna terreno in termini di privacy e controllo.

Gialoma

Le aziende statunitensi puntano su IA più grande mentre la Cina dimostra efficienza con modelli più piccoli.

Gianro Compagno

Articoli Recenti

Avviso di privacy: Chrome installa Gemini Nano sul tuo PC senza consenso

Il pericolo vertiginoso di fronte all'abisso dell'intelligenza artificiale

Antonio Díaz (Evoluzione): "L'IA ha radici dal 2002, la generativa è solo l'evoluzione attuale."

Categorie Popolari