HomeIACome i cervelli umani, i grandi modelli linguistici elaborano dati diversi in...

Come i cervelli umani, i grandi modelli linguistici elaborano dati diversi in modo generale

Mentre i primi modelli linguistici erano limitati all’elaborazione del testo, i moderni modelli linguistici di grandi dimensioni (LLM) sono in grado di gestire una vasta gamma di compiti su diversi tipi di dati. Questi modelli avanzati possono comprendere molte lingue, generare codice informatico, risolvere problemi matematici e persino rispondere a domande su immagini e audio.

Un gruppo di ricercatori del MIT ha esplorato il funzionamento interno degli LLM per comprendere meglio come questi modelli elaborano dati così diversi. Hanno scoperto che esistono somiglianze con il cervello umano. I neuroscienziati suggeriscono che il cervello umano possiede un “hub semantico” nel lobo temporale anteriore, che integra informazioni semantiche da varie modalità, come dati visivi e input tattili. Questo hub è collegato a “raggi” specifici della modalità che indirizzano le informazioni verso di esso.

Analogamente, i ricercatori del MIT hanno scoperto che gli LLM utilizzano un meccanismo simile, elaborando in modo astratto i dati provenienti da diverse modalità in modo centralizzato e generalizzato. Ad esempio, un modello con l’inglese come lingua dominante potrebbe utilizzare l’inglese come mezzo centrale per elaborare input in giapponese o per ragionare su aritmetica e codice informatico.

Inoltre, i ricercatori hanno dimostrato che è possibile intervenire nel centro semantico di un modello utilizzando il testo nella lingua dominante del modello per modificare le sue uscite, anche quando il modello elabora dati in altre lingue. Questo approccio ha portato a prestazioni molto impressionanti, ma c’è ancora molto da scoprire sui meccanismi interni di questi modelli.

“Spero che questo possa essere un primo passo per capire meglio come funzionano, in modo da poterli migliorare e controllare meglio quando necessario”, afferma Zhaofeng Wu, studente laureato in ingegneria elettrica e informatica (EECS) e autore principale di un articolo su questa ricerca. I suoi coautori includono Xinyan Velocity Yu, studente laureato presso l’Università della California del Sud (USC); Dani Yogatama, professore associato presso l’USC; Jiasen Lu, ricercatore scientifico di Apple; e l’autore senior Yoon Kim, assistente professore di EECS al MIT e membro del Computer Science and Artificial Intelligence Laboratory (CSAIL).

Fonte: Science Daily

Per saperne di più

Salvatore Macrì
Salvatore Macrìhttps://it.linkedin.com/in/salmacri
Amante della tecnologia e della buona musica, scrivo articoli per passione e per delucidare delle tematiche legate alla vita quotidiana per rendere questo mondo meno complicato. Sensibile ai temi ambientali e strenue sostenitore di una "green revolution" che nasca dal basso.
TI POTREBBERO INTERESSARE

ARTICOLI CONSIGLIATI

L’AI deve imparare a dire “non ne sono sicura”

L’AI deve imparare a dire “non ne sono sicura”

C’è una cosa che, usando un chatbot moderno, dà quasi fastidio: il tono. Anche quando sbaglia, spesso lo fa con una sicurezza da professore in cattedra. Ed è proprio qui che il nuovo lavoro del MIT CSAIL diventa interessante. Non parla dell’ennesimo modello più potente, più veloce o più “intelligente”, ma di qualcosa di molto più concreto: insegnare all’AI a capire quando non dovrebbe essere così convinta della propria risposta.
IA consuma molto energia?

L’AI consuma troppa energia? Il MIT ha trovato un...

L’intelligenza artificiale sta diventando sempre più potente, ma anche sempre più affamata di energia. Ogni volta che un modello viene addestrato, interrogato o spinto a lavorare su milioni di richieste, da qualche parte ci sono GPU accese, sistemi di raffreddamento attivi e data center che devono reggere carichi difficili da prevedere.La novità arriva dal MIT e dal MIT-IBM Watson AI Lab: si chiama EnergAIzer ed è un metodo pensato per stimare rapidamente quanta energia consumerà un carico di lavoro AI su una determinata GPU o su un acceleratore dedicato. Non è il classico annuncio “green” un po’ vago, di quelli che promettono miracoli senza spiegare davvero dove stia il vantaggio. Qui il punto è molto concreto: sapere prima quanto costerà, in termini energetici, far girare un certo modello.

Quasi 15 milioni di italiani usano app di IA:...

A dicembre 2025 quasi 15 milioni di italiani hanno usato almeno un’app di intelligenza artificiale: parliamo del 35% della popolazione online (18–74 anni) e di una media annua di 12,7 milioni, più del doppio rispetto al 2024.Il dettaglio che fa rumore, però, è un altro: ChatGPT supera i 10 milioni di utenti unici e viene usato da quasi un italiano su quattro. Non è più il giocattolo da provare una volta e poi dimenticare. È entrato nel quotidiano, nel bene e nel male.
Logo Chat GPT

OpenAI prepara una “super app” per PC: ChatGPT, Codex...

Negli ultimi mesi mi è capitato spesso di usare ChatGPT in una finestra, un tool di coding in un’altra, e poi… il browser, perché alla fine tutto passa da lì. È un flusso un po’ spezzato, “a pezzi”, e se lavori davvero con l’AI te ne accorgi subito. Ecco perché la voce che gira oggi ha senso: OpenAI starebbe lavorando a una super app desktop capace di unire le sue esperienze principali e, soprattutto, spingere forte sugli agenti (quelli che non si limitano a rispondere: agiscono).