Google DeepMind ha svelato oggi Gemini Robotics, un’iniziativa che mira a portare l’intelligenza artificiale nel mondo fisico. Con nuovi modelli capaci di affrontare una gamma più ampia di compiti reali, l’obiettivo è sviluppare robot a scopo generale. Sundar Pichai, CEO di Google, ha sottolineato come la robotica sia sempre stata vista come un campo di prova ideale per applicare i progressi dell’IA nel mondo reale.
Gemini Robotics
Il cuore di questa innovazione è il modello di visione-linguaggio-azione (VLA) basato su Gemini 2.0. Questo modello introduce azioni fisiche come nuova modalità di output, permettendo il controllo diretto dei robot. Google ha identificato tre qualità principali per i modelli di IA robotica: generalità, interattività e adattabilità.
Generalità
Una delle caratteristiche distintive di Gemini Robotics è la sua capacità di adattarsi a situazioni diverse. Questo sistema è in grado di gestire nuovi oggetti, seguire istruzioni diverse e operare in ambienti sconosciuti. Anche quando si trova di fronte a compiti mai affrontati durante l’addestramento, Gemini Robotics sfrutta la comprensione del mondo acquisita da Gemini per affrontarli con successo.
Interattività
Un altro aspetto fondamentale è l’interattività. Gemini Robotics è progettato per comprendere e rispondere rapidamente alle istruzioni o ai cambiamenti nell’ambiente circostante. Questa capacità di interazione dinamica è essenziale per operare efficacemente nel mondo fisico, dove le condizioni possono variare rapidamente.
Fonte: 9to5Google
Ricevi le ultime attualità sul mondo tech!