L'intelligenza artificiale (IA) è sempre più presente in settori chiave come la medicina, il diritto, la scienza, la comunicazione e l'ingegneria. Tuttavia, un recente studio dell'Università di Stanford (California, USA) avverte su una limitazione fondamentale: i modelli di linguaggio che sostengono queste tecnologie non riescono ancora a differenziare in modo affidabile tra credenze false e fatti, il che può portare a diagnosi errate, errori giudiziari e diffusione di disinformazione.
La ricerca, basata su circa 13.000 domande, ha rivelato che "tutti i modelli valutati falliscono nell'identificare credenze false in prima persona". Ad esempio, GPT riduce la sua precisione dal 98,2% al 64,4% e DeepSeek R1 scende da oltre il 90% al 14,4%. Quando le credenze errate vengono presentate in terza persona, la precisione migliora: i modelli più avanzati raggiungono fino al 95% e quelli più vecchi un 79%. Secondo Mirac Suzgun, ricercatore principale del Dipartimento di Scienze Informatiche di Stanford, questo evidenzia un "preoccupante bias di attribuzione". Gli autori sottolineano che la maggior parte dei modelli manca di una comprensione solida sulla natura fattuale della conoscenza, il che richiede miglioramenti urgenti prima del loro utilizzo in ambiti dove distinguere tra evidenza e credenza è essenziale.
A differenza degli esseri umani, che possono separare fatti da opinioni o credenze non verificate, anche i sistemi di IA più avanzati mancano di questa capacità, secondo l'articolo pubblicato su Nature. Questa carenza può generare conflitti su temi sensibili come vaccini, cambiamento climatico o politiche di salute pubblica, dove la differenza tra convinzione personale ed evidenza empirica è cruciale per il processo decisionale e il dibattito sociale. Lo studio ha analizzato modelli come GPT-4, DeepSeek R1, o1, Gemini 2, Claude-3 e Llama-3, e ha concluso che la comprensione di questi sistemi rimane limitata in aree come diagnosi medica, salute mentale, analisi giuridica, giornalismo, educazione, ricerca scientifica, consulenza finanziaria e terapia delle relazioni personali.