mercoledì, 11 Febbraio 2026
HomeIALo studio potrebbe migliorare le capacità di ragionamento complesso degli LLM in...

Lo studio potrebbe migliorare le capacità di ragionamento complesso degli LLM in italiano

Nonostante le loro capacità impressionanti, i grandi modelli linguistici (LLM) spesso non riescono a eccellere quando vengono assegnati nuovi compiti impegnativi che richiedono capacità di ragionamento complesse. Ad esempio, un LLM sviluppato per un’azienda contabile potrebbe essere eccezionale nel riassumere rapporti finanziari, ma potrebbe fallire inaspettatamente se incaricato di prevedere le tendenze del mercato o identificare transazioni fraudolente.

Adattabilità dei modelli linguistici

Per migliorare l’adattabilità degli LLM, i ricercatori del MIT hanno esplorato una tecnica di addestramento innovativa. Questa tecnica mira a potenziare le prestazioni di un modello su problemi difficili e sconosciuti. In particolare, l’addestramento in tempo di prova, che comporta l’aggiornamento temporaneo di alcuni meccanismi interni di un modello durante la distribuzione, ha dimostrato di migliorare la precisione fino a sei volte.

Implementazione della strategia di formazione

I ricercatori hanno sviluppato un quadro per implementare una strategia di formazione in tempo di prova che utilizza esempi del nuovo compito per massimizzare i guadagni di prestazione. Questo approccio potrebbe migliorare la flessibilità di un modello, consentendo a un LLM standard di adattarsi a compiti complessi che richiedono pianificazione o astrazione.

Applicazioni pratiche

Questa innovazione potrebbe portare a LLM più accurati in molte applicazioni che richiedono deduzione logica, dalla diagnostica medica alla gestione della catena di approvvigionamento. “L’apprendimento autentico – quello che abbiamo fatto qui con l’addestramento in tempo di prova – è qualcosa che questi modelli non possono fare da soli dopo essere stati spediti. Non possono acquisire nuove abilità o migliorare un compito. Ma abbiamo dimostrato che se si spinge un po’ il modello a fare l’apprendimento reale, si vedono enormi miglioramenti nelle prestazioni”, afferma Ekin Akyürek PhD ’25, autore principale dello studio.

Collaborazione e contributi

Akyürek è stato affiancato nello studio da Mehul Damani, Linlu Qiu, Han Guo e Jyothish Pari; Adam Zweiger; e Yoon Kim, assistente professore di ingegneria elettrica e informatica (EECS) e membro del Computer Science and Artificial Intelligence Laboratory (CSAIL); e Jacob Andreas, professore associato di EECS e membro di CSAIL.

 

Fonte: MIT

Leggi di più

foto credit: Credit: Jose-Luis Olivares, MIT; iStock

Salvatore Macrì
Salvatore Macrìhttps://it.linkedin.com/in/salmacri
Amante della tecnologia, della buona musica e dello sport, scrivo articoli per passione e per delucidare delle tematiche legate alla vita quotidiana per rendere questo mondo meno complicato. Sensibile ai temi ambientali e strenue sostenitore di una "green revolution" che nasca dal basso. Mi dedico per passione anche a scrivere pronostici sportivi dettagliati anche grazie all'analisi approfondita delle statistiche, grazie all'IA.
TI POTREBBERO INTERESSARE

ARTICOLI CONSIGLIATI

Earth-2 NVIDIA

NVIDIA Earth-2: i nuovi modelli AI meteo promettono previsioni...

Negli Stati Uniti, in queste ore, una grossa tempesta invernale sta mettendo in crisi la solita routine: apri l’app meteo, guardi la previsione, poi apri un’altra app… e trovi numeri diversi, spesso lontani tra loro. È il tipo di scenario che ti ricorda quanto la meteorologia, anche nel 2026, resti una scienza difficile da “impacchettare” in una notifica.In mezzo a questo caos, NVIDIA ha scelto un timing quasi perfetto per presentare la sua nuova famiglia di modelli AI per il meteo, parte del progetto Earth-2. E qui la notizia non è solo “una big tech fa un modello”. È un salto di ambizione: NVIDIA parla di strumenti aperti, più veloci, e con performance che — almeno sulla carta — mettono pressione anche ai nomi grossi già in campo.
Gemini 3 Pro

Gemini 3 Pro: l’intelligenza artificiale di Google entra in...

Con il rilascio di Gemini 3 Pro, Google ha fatto un passo deciso verso un’intelligenza artificiale più “umana” — capace non solo di rispondere,...
Claude AI Logo

Anthropic presenta Claude Sonnet 4.5: nuovo modello avanzato per...

Anthropic ha appena lanciato Claude Sonnet 4.5, evoluzione importante della serie Sonnet che mira a spingere oltre i limiti ciò che i modelli AI...
Logo Chat GPT

ChatGPT diventa negozio: arriva Instant Checkout

OpenAI ha introdotto Instant Checkout, una funzione che consente agli utenti di acquistare articoli direttamente all’interno di ChatGPT, senza uscire dall’interfaccia. Per ora, il...