OpenAI ha annunciato un’importante novità per gli utenti di ChatGPT: il chatbot basato su intelligenza artificiale ora è in grado di generare immagini contestualmente alla conversazione testuale. La nuova funzionalità è stata battezzata “ChatGPT Immagini” e rappresenta un ulteriore passo nell’integrazione tra linguaggio e visione artificiale all’interno dello stesso modello AI.
Un’evoluzione resa possibile da GPT-4o
La novità è resa operativa grazie al nuovo modello omnimodale GPT-4o (dove “o” sta per omnimodal, ovvero multimodale), capace di comprendere e generare contenuti sia testuali che visivi. Con questa funzione, gli utenti possono richiedere direttamente all’AI di creare un’immagine durante una conversazione, senza dover passare per un tool esterno come DALL·E o Midjourney.
La funzionalità è già disponibile per gli abbonati ai piani ChatGPT Plus, Pro e Team, sia in versione gratuita che a pagamento. Il rilascio per gli account Enterprise ed Edu è previsto a breve.
Immagini fotorealistiche e testo accurato
Secondo quanto dichiarato sul blog ufficiale di OpenAI, ChatGPT Immagini è in grado di produrre immagini fotorealistiche e dettagliate, superiori rispetto ai risultati ottenuti con generatori IA precedenti.
Uno degli aspetti più innovativi riguarda la gestione del testo all’interno delle immagini, storicamente una debolezza dell’IA generativa: ora il sistema è in grado di scrivere testi coerenti, leggibili e privi di errori ortografici nelle immagini stesse.
Un sistema diverso dalla diffusione
Dal punto di vista tecnico, ChatGPT immagini non utilizza un modello di diffusione (come DALL·E), ma un approccio autoregressivo, cioè l’immagine viene costruita progressivamente, elemento dopo elemento, proprio come il testo. Questo tipo di costruzione consente un controllo più preciso del contenuto visivo e delle sue caratteristiche.
Gabriel Goh, responsabile della ricerca di OpenAI, ha spiegato a The Verge che il modello è il risultato di mesi di piccoli ma continui miglioramenti, che ora permettono di ottenere immagini con qualità professionale.
Privacy e trasparenza: niente filigrane, ma metadati
A differenza di altri strumenti che inseriscono filigrane visive per indicare la natura artificiale dell’immagine, OpenAI ha scelto una strada diversa: ogni immagine generata includerà metadati standard per certificare la propria origine. In questo modo, si favorisce la tracciabilità senza compromettere l’estetica dell’immagine.
Fonte: Ansa
Ricevi le ultime attualità sul mondo tech!