Imagen: il software di Google che traduce i testi in immagini
Una novità sta per arrivare da Mountain View: Google si sta occupando di un nuovo, strabiliante prodotto, che ha già un nome: si chiama Imagen.
Sfruttando l’Intelligenza Artificiale, il tool partirà da un testo, che verrà trasformato in immagini. Sono già state diffuse varie immagini sul web, generate interamente tramite Imagen.
In questo articolo scopriremo insieme tutti i dettagli sul nuovo prodotto realizzato da Google e sul suo funzionamento. Ci concentreremo anche sulle sue origini: in effetti, non si tratta del primo prodotto del suo genere.
Imagen: cos’è e come funziona il nuovo tool firmato Google
Ma andiamo per ordine. Per prima cosa, cerchiamo di capire cos’è Imagen con esattezza. Si tratta di un prodotto “text to image” che, utilizzando l’Intelligenza Artificiale, crea delle immagini partendo da un testo.
Nello specifico, grazie ai complessi meccanismi machine learning, il tool analizza il testo di partenza, che sarà la base di partenza per un prodotto di tipo grafico.
L’idea alla base del nuovo prodotto Google prevede quindi di partire da un contenuto testuale per produrre un’immagine o un prodotto fotografico. Detto altrimenti, basta comunicare testualmente al tool quali caratteristiche dovrà avere un’immagine e Imagen realizzerà un prodotto avente le caratteristiche da noi scritte.
Le immagini verranno realizzate tramite l’applicazione utilizzando dei dati che verranno estrapolati da un enorme database.
Un prodotto non ancora rilasciato
C’è da sottolineare che, al momento, Imagen non è ancora stato rilasciato, nel senso che non è ancora possibile, per gli utenti, iniziare ad utilizzarlo.
Al momento, sul sito del prodotto in questione, vengono mostrati dei contenuti visivi generati tramite il nuovo prodotto di casa Google. Tuttavia, si tratta probabilmente dei prodotti migliori attualmente realizzati tramite la nuova tecnologia.
In effetti, quelle mostrate sono immagini particolarmente suggestive, che restano impresse nelle nostre menti anche per via dei loro colori particolarmente sgargianti. Le immagini mostrate come esempio da Mountain View sono anche di alta qualità.
Tuttavia, è molto probabile che si tratti dei prodotti migliori attualmente realizzati con l’ausilio di Imagen. Infatti, di solito le immagini prodotte a partire da contenuti testuali e che vengono realizzate sfruttando l’Intelligenza Artificiale, che deve combinare i dati presenti in un enorme database, conducono a dei risultati poco soddisfacenti.
Inoltre, il fatto che il prodotto non sia ancora stato rilasciato e che non sia utilizzabile dagli utenti lascia supporre che Imagen abbia ancora necessità di essere modificato.
E non sappiamo, ancora oggi, quando potremo iniziare ad utilizzare questo particolare prodotto.
Gli “antenati” di Imagen
Se Imagen potrebbe a prima vista sembrare un prodotto unico nel suo genere, bisogna considerare che non si tratta del primo tool simile.
Google stesso, già a partire dal 2015, inizio ad utilizzare un complesso sistema di algoritmi che, di concerto con varie reti neurali, generava immagini.
Si chiama Deep Dream Generator ed il suo sito ufficiale è ancora online. Questo primo generatore di immagini è in grado di produrre contenuti visivi molto stimolanti. Anche in questo caso, i prodotti generati possiedono colori vivaci ed attraenti. Come li definisce Google stesso, quasi “onirici”, in grado di rimandare al mondo dei sogni.
Non a caso, il primo nome che era stato dato il prodotto era Inception, per ricalcare il film del 2010 diretto da Christopher Nolan. Un film che, per l’appunto, esplora vari concetti che hanno a che fare con la complessità dei sogni.
L’applicazione Deep Dream è in grado, tramite l’AI, di riconoscere e rielaborare le immagini, per restituire prodotti quasi surreali.
Un meccanismo differente rispetto ad Imagen, che rappresenta una sorta di evoluzione di Deep Dream Generator.
Ma la possibilità di creare immagini partendo da testi non è stata esplorata per la prima volta dal team Google. Infatti, Imagen è stato preceduto da altri prodotti analoghi realizzati dalla concorrenza.
Impossibile, ad esempio, non citare la OperAI di Elon Musk, l’organizzazione che si propone di utilizzare l’Intelligenza Artificiale con scopi benefici. Tra i prodotti dell’organizzazione, abbiamo anche DALL-E 2.
Si tratta di un sistema che sfrutta l’intelligenza artificiale e che è in grado di creare immagini e disegni realistici da una descrizione scritta. Insomma, un prodotto simile a Imagen.
Quali sono le sue potenzialità
Prodotti come Imagen ed i suoi analoghi hanno delle potenzialità innegabili.
Secondo le intenzioni del gruppo creativo che sta alla base della creazione dell’applicazione, questo tipo di tecnologia potrebbe essere in grado di potenziare la creatività. Si basa infatti sul lavoro effettuato tramite l’Intelligenza Artificiale, che viene però reso ancor più potente grazie alla creatività umana.
Sarà poi possibile scegliere tra differenti stili. Non abbiamo infatti ancora detto che Imagen non si limita a produrre immagini in stile scatto fotografico.
È anche possibile scegliere un diverso tipo di resa: giusto per fare un esempio, le immagini possono assumere l’aspetto di un dipinto ad olio.
Google promette inoltre un grado di realismo particolarmente elevato. Le immagini prodotte con Imagen potrebbero quindi avere differenti tipologie di utilizzi e applicazioni. Poter trasformare un testo o una semplice idea, anche astratta, in immagini potrebbe essere utilissimo in ogni campo.
Una tecnologia che comporta dei rischi
Se è vero che Imagen potrà apportare delle novità positive, non bisogna comunque sottovalutare tutti i rischi che questo nuovo tipo di tecnologia potrà comportare.
Tralasciando i problemi legati alla generazione dei prodotti fotografici di cui abbiamo già accennato, a preoccupare non è di certo la qualità dubbia delle immagini create.
Restano infatti da risolvere due problemi fondamentali. Innanzitutto, attingere da un database enorme potrebbe comportare la creazione di immagini dannose o disturbanti. Gli algoritmi che sottendono la creazione dei prodotti fotografici dovranno cioè essere addestrati a riconoscere ed eliminare i prodotti che potrebbero generare problematiche di tipo etico.
Ma questo non è l’unico problema che Google dovrà risolvere.
L’algoritmo dovrà anche essere in grado di individuare l’autore delle opere create. Un’operazione che, data l’ampiezza della banca dati utilizzata, che combinerà tra loro molteplici immagini esistenti, potrebbe rivelarsi molto complessa.
In ogni caso, c’è ancora tempo per risolvere tali problematiche, dato che la data di rilascio di Imagen al pubblico non si conosce ancora.