Con il lancio del Pixel 10, Google ha annunciato l’espansione di Gemini Live, che ora offre un’uscita audio nativa per conversazioni più reattive ed espressive su Android. Ad agosto, Google aveva anticipato nuovi aggiornamenti del modello, probabilmente il Gemini 2.5 Flash Live API, che promettono di migliorare notevolmente l’uso degli elementi chiave del linguaggio umano da parte di Gemini Live. Questo include l’intonazione, il ritmo e il tono della voce. Ad esempio, se l’utente appare stressato o discute di un argomento stressante, Gemini Live potrebbe rispondere con una voce più calma e misurata.
Inoltre, gli utenti possono personalizzare il modo in cui Gemini parla, scegliendo un accento specifico (come britannico o australiano) e regolando la velocità dell’output. Queste impostazioni durano per tutta la durata della conversazione, ma possono essere ripristinate accedendo alla trascrizione della chat e toccando il pulsante Live nell’angolo. Altrimenti, i controlli precedenti si resettano all’inizio di una nuova conversazione. A fine agosto, Google ha dichiarato che questa funzione sarebbe stata disponibile “nelle prossime settimane”. Negli ultimi giorni, abbiamo osservato una maggiore disponibilità per gli account a pagamento (Google AI Pro) su dispositivi Pixel e altri telefoni Android.
Guida visiva e nuove funzionalità su android
Parallelamente, la guida visiva che evidenzia oggetti nel mondo reale è stata ampiamente distribuita su Android, inclusi gli account gratuiti. Introdotta con la serie Pixel 10, questa funzione utilizza un rettangolo arrotondato che oscura leggermente lo sfondo con un’animazione di messa a fuoco. Basta aggiungere “mostrami” o “dove si trova” nel comando per attivarla. Tuttavia, l’audio nativo o la guida su schermo non sono ancora disponibili sui dispositivi iOS che abbiamo controllato oggi.
Infine, il nuovo design a schermo intero del menu dell’account Google è ora disponibile nell’app Gemini su Android (e iOS). Simile all’app Google, Gemini utilizza l’intera pagina e richiede di scorrere verso il basso per accedere alle impostazioni.
Considerazioni finali
Le nuove funzionalità di Gemini Live rappresentano un passo avanti significativo nel rendere le interazioni vocali con l’intelligenza artificiale più naturali e personalizzabili. La possibilità di adattare l’intonazione e il ritmo della voce in base al contesto della conversazione è un’aggiunta interessante che potrebbe migliorare notevolmente l’esperienza utente. Inoltre, la guida visiva su Android offre un ulteriore livello di interazione, rendendo i dispositivi ancora più intuitivi e facili da usare. Tuttavia, l’assenza di queste funzionalità su iOS potrebbe rappresentare un limite per gli utenti di dispositivi Apple. In generale, queste innovazioni dimostrano l’impegno di Google nel migliorare continuamente l’interazione tra uomo e macchina, rendendo la tecnologia sempre più accessibile e personalizzata.
Fonte: 9to5Google




