HomeIAL’AI deve imparare a dire “non ne sono sicura”

L’AI deve imparare a dire “non ne sono sicura”

C’è una cosa che, usando un chatbot moderno, dà quasi fastidio: il tono. Anche quando sbaglia, spesso lo fa con una sicurezza da professore in cattedra. Ed è proprio qui che il nuovo lavoro del MIT CSAIL diventa interessante. Non parla dell’ennesimo modello più potente, più veloce o più “intelligente”, ma di qualcosa di molto più concreto: insegnare all’AI a capire quando non dovrebbe essere così convinta della propria risposta.

Il problema non è solo l’allucinazione

Quando si parla di allucinazioni dell’AI, di solito ci si concentra sull’errore: una data inventata, una fonte inesistente, una spiegazione credibile ma falsa. Il punto, però, è che l’errore diventa molto più pericoloso quando viene presentato con sicurezza assoluta.

Secondo i ricercatori del MIT, molti modelli di ragionamento vengono addestrati con sistemi di ricompensa troppo binari: risposta giusta, premio; risposta sbagliata, penalità. Tutto qui. Il problema è che questo schema non distingue tra un modello che ragiona davvero e uno che indovina per fortuna. Nel tempo, il modello impara che conviene comunque rispondere, anche quando le basi sono fragili.

È un difetto sottile, ma decisivo. Perché un’AI che dice “sono sicura al 95%” quando in realtà ha ragione una volta su due non è solo imprecisa: è fuorviante.

Come funziona RLCR

La tecnica presentata dal MIT si chiama RLCR, cioè Reinforcement Learning with Calibration Rewards. In pratica, durante l’addestramento il modello non deve limitarsi a produrre una risposta, ma deve anche stimare quanto è sicuro di quella risposta. La novità sta nella ricompensa: oltre al classico punteggio per la correttezza, viene introdotto il Brier score, una misura usata per valutare quanto una previsione probabilistica sia ben calibrata.

Tradotto: se il modello risponde con grande sicurezza e sbaglia, viene penalizzato. Se invece è troppo incerto su una risposta corretta, viene penalizzato anche lì. L’obiettivo non è creare un’AI timida, che dice sempre “non lo so”, ma un sistema capace di dosare meglio la propria affidabilità.

Nei test citati dal MIT, RLCR ha ridotto l’errore di calibrazione fino al 90%, mantenendo o migliorando l’accuratezza su diversi benchmark, compresi dataset mai visti dal modello durante l’addestramento. Questo è il dettaglio più importante: non si tratta solo di rendere l’AI più prudente, ma di farlo senza renderla meno utile.

Perché questa ricerca conta davvero

La questione non riguarda soltanto chi usa ChatGPT per farsi aiutare con una mail o una ricetta. Nei settori dove le decisioni pesano — medicina, finanza, diritto, ricerca scientifica — sapere quanto fidarsi di una risposta è quasi importante quanto la risposta stessa.

Altri lavori recenti vanno nella stessa direzione: la calibrazione della fiducia, l’astensione e la capacità di segnalare incertezza stanno diventando temi centrali per ridurre le allucinazioni e rendere i modelli meno inclini a “tirare a indovinare”. Alcuni studi parlano proprio del rischio di modelli addestrati come “bravi studenti da test”, spinti a dare sempre una risposta pur di massimizzare il punteggio.

Ed è qui che, da osservatore tech, vedo il cambio di passo. Per anni l’industria ha inseguito soprattutto la performance: più parametri, più benchmark, più velocità. Ora inizia a emergere una domanda più matura: un modello sa riconoscere i propri limiti?

Non è una bacchetta magica

Attenzione però a non vendere questa ricerca come la cura definitiva alle allucinazioni. Un modello ben calibrato può comunque sbagliare. Può stimare male la propria incertezza in domini nuovi, può essere influenzato dal modo in cui viene posta la domanda, può diventare troppo conservativo se il sistema di ricompensa non è bilanciato bene.

Il vero valore di RLCR, almeno oggi, è aprire una strada più credibile: non basta chiedere all’AI “sei sicura?”, perché spesso i modelli sono bravissimi anche a sembrare riflessivi. Serve incorporare questa capacità nel training, non appiccicarla sopra con un prompt gentile.

Cosa cambia davvero

A mio parere questa è una delle direzioni più sane per l’AI dei prossimi anni. Meno spettacolare di una demo con video generativi o agenti autonomi, certo. Ma molto più utile nella vita reale.

Un assistente AI davvero affidabile non dovrebbe solo rispondere bene. Dovrebbe anche saper dire: “qui ho pochi elementi”, “questa risposta è probabile ma non certa”, “meglio verificare”. Può sembrare una piccola sfumatura linguistica, invece è una differenza enorme. Perché la fiducia non nasce da un tono sicuro, nasce dalla capacità di ammettere il dubbio.

FAQ

Che cosa ha sviluppato il MIT?

Il MIT CSAIL ha presentato RLCR, una tecnica di addestramento che aiuta i modelli AI a produrre risposte accompagnate da stime di fiducia più accurate.

Questo elimina le allucinazioni dell’AI?

No. Può ridurre il rischio di risposte sbagliate presentate con troppa sicurezza, ma non rende i modelli infallibili.

Perché è importante che un’AI dica “non lo so”?

Perché in molti contesti l’utente non deve solo ricevere una risposta, ma capire quanto quella risposta sia affidabile. Una buona stima dell’incertezza rende l’AI più trasparente e meno pericolosa.

Mara De Nicola
Mara De Nicolahttps://sotutto.it
Ciao, sono Mara, mi piace scrivere articoli sul benessere psico-fisico e di tutto ciò che aiuta a vivere meglio ogni giorno. Fan sfegatata di Yannick Sinner, con una grande passione per la cucina, amo anche viaggiare all’estero per scoprire nuove culture e allargare i miei orizzonti. Mi capita talvolta di scrivere anche articoli su scienze e IA.
TI POTREBBERO INTERESSARE

ARTICOLI CONSIGLIATI

IA consuma molto energia?

L’AI consuma troppa energia? Il MIT ha trovato un...

L’intelligenza artificiale sta diventando sempre più potente, ma anche sempre più affamata di energia. Ogni volta che un modello viene addestrato, interrogato o spinto a lavorare su milioni di richieste, da qualche parte ci sono GPU accese, sistemi di raffreddamento attivi e data center che devono reggere carichi difficili da prevedere.La novità arriva dal MIT e dal MIT-IBM Watson AI Lab: si chiama EnergAIzer ed è un metodo pensato per stimare rapidamente quanta energia consumerà un carico di lavoro AI su una determinata GPU o su un acceleratore dedicato. Non è il classico annuncio “green” un po’ vago, di quelli che promettono miracoli senza spiegare davvero dove stia il vantaggio. Qui il punto è molto concreto: sapere prima quanto costerà, in termini energetici, far girare un certo modello.

Quasi 15 milioni di italiani usano app di IA:...

A dicembre 2025 quasi 15 milioni di italiani hanno usato almeno un’app di intelligenza artificiale: parliamo del 35% della popolazione online (18–74 anni) e di una media annua di 12,7 milioni, più del doppio rispetto al 2024.Il dettaglio che fa rumore, però, è un altro: ChatGPT supera i 10 milioni di utenti unici e viene usato da quasi un italiano su quattro. Non è più il giocattolo da provare una volta e poi dimenticare. È entrato nel quotidiano, nel bene e nel male.
Logo Chat GPT

OpenAI prepara una “super app” per PC: ChatGPT, Codex...

Negli ultimi mesi mi è capitato spesso di usare ChatGPT in una finestra, un tool di coding in un’altra, e poi… il browser, perché alla fine tutto passa da lì. È un flusso un po’ spezzato, “a pezzi”, e se lavori davvero con l’AI te ne accorgi subito. Ecco perché la voce che gira oggi ha senso: OpenAI starebbe lavorando a una super app desktop capace di unire le sue esperienze principali e, soprattutto, spingere forte sugli agenti (quelli che non si limitano a rispondere: agiscono).

Meta vuole meno moderatori umani e più IA: cosa...

Se negli ultimi anni ti è capitato di segnalare un profilo fake, una truffa “troppo bella per essere vera” o un post chiaramente fuori linea, hai già visto come funziona la moderazione su Meta: una miscela di algoritmi, sistemi automatici e (soprattutto) tantissime persone pagate per guardare il peggio del web. Ora Meta sta spostando l’ago della bilancia: meno controllo umano esterno, più sistemi di intelligenza artificiale basati su modelli linguistici.La notizia è del 20 marzo 2026 e arriva insieme a un altro pezzo del puzzle: Meta AI support assistant, una specie di “help desk” dentro Facebook e Instagram che promette risposte rapide e azioni dirette sull’account.