Anthropic ha appena lanciato Claude Sonnet 4.5, evoluzione importante della serie Sonnet che mira a spingere oltre i limiti ciò che i modelli AI possono fare, specialmente nel campo del coding e nel supporto alla creazione di agenti autonomi.
Tra le novità, Sonnet 4.5 introduce checkpoints per Claude Code — in pratica salvataggi intermedi che permettono di tornare a uno stato precedente del lavoro — una nuova interfaccia terminal, un’estensione VS Code nativa, e potenziamenti nella memoria degli agenti e nella gestione del contesto.
Nella versione app, il modello ora supporta l’esecuzione diretta di codice e la creazione di file (foglio di calcolo, presentazioni, documenti) all’interno della conversazione con l’IA. Inoltre, l’estensione Claude per Chrome è stata resa disponibile per gli utenti Max che erano in lista d’attesa.
Anthropic ha anche rilasciato il Claude Agent SDK, kit di sviluppo che consente agli sviluppatori di costruire agenti personalizzati basati sull’infrastruttura interna di Claude.
Secondo l’azienda, Sonnet 4.5 migliora notevolmente l’allineamento del modello: comportamenti indesiderati come la “sycophancy” (l’eccesso di adulazione), la tendenza alla menzogna o commenti fuorvianti sono stati attenuati attraverso addestramenti mirati.
Dal punto di vista delle prestazioni, Claude Sonnet 4.5 scala bene: Anthropic afferma che il modello può mantenersi focalizzato su compiti complessi per oltre 30 ore, ed è “state-of-the-art” sul benchmark SWE-bench Verified, che misura capacità reali di generazione di codice.
Prezzi e struttura restano coerenti con Sonnet precedente: per l’uso via API resta lo stesso schema token input/output. Sonnet 4.5 è oggi disponibile ovunque come opzione attiva per gli utenti Claude e sviluppatori.
Perché sonnet 4.5 è un passo avanti rilevante
Quello che rende 4.5 più interessante rispetto alle versioni precedenti è l’unione di tre elementi:
- Persistenza nel tempo: non più IA che “perde il filo” dopo pochi minuti, ma modelli che possono portare avanti task lunghi e articolati.
- Strumenti nativi integrati: la capacità di generare documenti, fogli, presentazioni, eseguire codice e manipolare file direttamente nel flusso conversazionale offre un salto di utilità.
- Controllo e sviluppo: con il kit Agent SDK diventa possibile non solo usare, ma costruire nuovi agenti personalizzati basati su un’architettura già rodata.
In sintesi: 4.5 vuole essere non solo un modello più “intelligente”, ma una piattaforma che consente agli utenti di trasformare prompt in flussi produttivi reali, con strumenti e persistenza.
Criticità, dubbi e punti da verificare
- Le dichiarazioni pubbliche parlano di riduzione dei comportamenti problematici, ma non c’è garanzia che gli errori o le “hallucination” siano eliminati del tutto.
- Alcuni sviluppatori in preview segnalano che, nonostante la velocità, il codice generato a volte è superficiale o “tronco” su progetti complessi, soprattutto quando si tratta di integrare pezzi esistenti già presenti nel repository.
- Serve verificare come Sonnet 4.5 risponde in contesti reali di progetti su larga scala (moduli multipli, dipendenze complesse, refactoring), non solo nei benchmark.
- L’interoperabilità con componenti legacy, plugin, librerie e ambienti di sviluppo reali potrebbe rivelarsi un nodo: la compatibilità è sempre un punto delicato.
- La promessa delle “30 ore” va testata in scenari reali, con carichi, interruzioni, cambi di strategia: nei laboratori è un conto, nell’uso quotidiano un altro.
Considerazioni finali
Claude Sonnet 4.5 è un prodotto che si propone non come “solo” modello AI, ma come un ambiente potenziato per sviluppo, agenti e interazione continua con strumenti reali. Le aggiunte come i checkpoints, l’esecuzione in linea e il kit SDK ne ampliano l’utilità concreta: non è più solo generazione, ma partecipazione attiva al ciclo produttivo. Se mantiene le promesse, potremmo trovarci davanti a una generazione di AI che smette di essere “assistente” per diventare “collaboratore”.





