Le aziende statunitensi puntano su IA più grande mentre la Cina dimostra efficienza con modelli più piccoli.
    Inteligencia Artificial (IA)

    Le aziende statunitensi puntano su IA più grande mentre la Cina dimostra efficienza con modelli più piccoli.

    Gianro Compagno
    2026-04-28
    5 min read
    Alibaba ha sorpreso il mondo dell'intelligenza artificiale con il lancio di Qwen3.6-27B, un modello di linguaggio aperto che ridefinisce le aspettative sui modelli compatti. Fino ad ora, l'azienda si era distinta per Qwen3.5-397B-A17B, un modello colossale con 397 miliardi di parametri e un peso di 807 GB, rendendolo poco accessibile per la maggior parte degli utenti. Tuttavia, il nuovo Qwen3.6-27B, nella sua versione quantizzata, riduce drasticamente le dimensioni a meno di 17 GB, senza sacrificare le prestazioni. A differenza della tendenza attuale verso architetture Mixture-of-Experts (MoE), dove solo una parte dei parametri viene attivata in ogni inferenza, Qwen3.6-27B è un modello denso: utilizza i suoi 27 miliardi di parametri in ogni operazione. Questo semplifica il suo utilizzo, elimina la necessità di configurare percorsi di esperti e consente una quantizzazione più efficiente e prevedibile. I risultati avvalorano questa scelta. In test come SWE-bench Verified, riferimento per compiti di programmazione, Qwen3.6-27B raggiunge il 77,2%, superando il modello da 397B, che ottiene il 76,2%. In Terminal-Bench 2.0, orientato a compiti in console, il nuovo modello ottiene il 59,3%, rispetto al 2,5% del suo predecessore, e pareggia persino con Claude Opus 4.5 di Anthropic, uno dei modelli commerciali più avanzati. Anche se questi dati provengono da Alibaba e manca ancora una verifica indipendente, le prime impressioni della comunità sono molto positive. Il team di Alibaba ha sottolineato le prestazioni di Qwen3.6-27B, posizionandolo al di sopra del suo precedente modello di punta. Questo riconoscimento interno sottolinea un cambiamento di paradigma: i modelli più piccoli possono competere, e persino superare, i giganti in compiti specifici. Un altro vantaggio chiave è la sua accessibilità. Con solo 24 GB di VRAM, schede come la RTX 3090 possono eseguire Qwen3.6-27B localmente con grande efficienza, qualcosa di impensabile con modelli più grandi. Anche se i modelli densi non rendono allo stesso modo su dispositivi con memoria unificata come i MacBook, la possibilità di eseguire IA avanzata su hardware relativamente accessibile è un notevole progresso. Alibaba aveva già mostrato il suo impegno per modelli compatti con lanci recenti di SLM tra 0,8B e 9B di parametri. Il mercato dei modelli piccoli si sta dinamizzando, con alternative come Gemma 4 di Google, Phi-4 di Microsoft o Devstral 2 di Mistral, dimostrando che la concorrenza arriva anche dall'Occidente. Nonostante le sue impressionanti prestazioni, Qwen3.6-27B conferma che i modelli cinesi open source sono ancora, secondo esperti come Demis Hassabis, tra 6 e 12 mesi indietro rispetto ai leader di Anthropic, OpenAI o Google. Inoltre, eseguire questi modelli localmente richiede un investimento considerevole in hardware. Per chi cerca la massima velocità ed efficienza, i servizi commerciali in cloud rimangono l'opzione preferita, anche se l'IA locale guadagna terreno in termini di privacy e controllo.
    Gianro Compagno

    Gianro Compagno

    CTO

    Gianro aporta una gran experiencia en gestión de proyectos tecnológicos en entornos multinacionales. Su experiencia técnica combinada con un MBA y una maestría en Psicología Investigativa crea un enfoque único para las soluciones tecnológicas. Como Experto en IA y Automatización, aplica conocimientos psicológicos para diseñar sistemas más intuitivos y centrados en el ser humano. Su enfoque orientado al detalle y mentalidad positiva aseguran que nuestras soluciones no solo sean innovadoras y confiables, sino que también se alineen con cómo las personas piensan y trabajan naturalmente.