Gemini deep think mode: un passo avanti nella risoluzione dei problemi matematici
Il tanto atteso Gemini Deep Think mode, annunciato all’I/O 2025, non è ancora disponibile, ma Google ha recentemente messo in luce come abbia raggiunto una performance da medaglia d’oro in una competizione matematica di alto livello. L’International Mathematical Olympiad (IMO) è la competizione più prestigiosa al mondo per giovani matematici, tenuta annualmente dal 1959. Ogni nazione partecipante è rappresentata da sei matematici d’élite, ancora in età pre-universitaria, che si sfidano nella risoluzione di sei problemi estremamente complessi in algebra, combinatoria, geometria e teoria dei numeri. Le medaglie vengono assegnate alla metà superiore dei partecipanti, con circa l’8% che riceve una prestigiosa medaglia d’oro.
La scorsa settimana si è tenuta l’IMO 2025, e una “versione avanzata di Gemini Deep Think ha risolto perfettamente cinque dei sei problemi dell’IMO, totalizzando 35 punti e raggiungendo una performance da medaglia d’oro.” Google ha condiviso le soluzioni in un documento PDF.
Per sfruttare al massimo le capacità di ragionamento di Deep Think, abbiamo addestrato questa versione di Gemini con tecniche di apprendimento per rinforzo innovative, in grado di sfruttare dati di ragionamento multi-step, risoluzione di problemi e dimostrazione di teoremi. Inoltre, abbiamo fornito a Gemini l’accesso a un corpus curato di soluzioni di alta qualità a problemi matematici, aggiungendo alcuni suggerimenti generali su come affrontare i problemi dell’IMO nelle sue istruzioni.
Nel maggio scorso, Google aveva dichiarato esplicitamente che il modello sottostante era Gemini 2.5 Pro. Il post sul blog di oggi si riferisce semplicemente a una “versione avanzata” o “Gemini avanzato”.
Questa competizione rappresenta una sfida significativa per le capacità avanzate di risoluzione dei problemi matematici e di ragionamento di un sistema AI. Nel 2024, Google DeepMind aveva ottenuto una medaglia d’argento (“risolvendo quattro dei sei problemi e totalizzando 28 punti”) utilizzando AlphaGeometry e AlphaProof con 2-3 giorni di calcolo. Tuttavia, i problemi dovevano prima essere tradotti dal linguaggio naturale in linguaggi specifici del dominio.
Quest’anno, Gemini ha “operato end-to-end in linguaggio naturale, producendo dimostrazioni matematiche rigorose direttamente dalle descrizioni ufficiali dei problemi – tutto entro il limite di tempo della competizione di 4,5 ore.”
Deep Think è una “modalità di ragionamento avanzata” che utilizza le “tecniche di ricerca più recenti”, come il pensiero parallelo. Questo setup consente al modello di esplorare e combinare simultaneamente più soluzioni possibili prima di fornire una risposta finale, piuttosto che seguire una singola catena di pensiero lineare.
Google afferma che renderà “una versione di questo modello Deep Think disponibile a un gruppo di tester fidati, inclusi matematici.” Successivamente, sarà disponibile su Google AI Ultra, ma non è chiaro quando verrà effettivamente lanciato per gli abbonati al livello da 250 dollari al mese.
Fonte: 9to5Google





