Foto Lee Unkrich, uno degli animatori più illustri della Pixar, come studente di seconda media. Sta fissando l’immagine di una locomotiva del treno sullo schermo del primo computer della sua scuola. oh!, lui pensa. Tuttavia, parte della magia svanisce quando Lee scopre che l’immagine non era apparsa semplicemente chiedendo “l’immagine di un treno”. Invece, doveva essere scrupolosamente codificato e reso, da esseri umani che lavorano sodo.
Ora immagina Lee 43 anni dopo, imbattersi in DALL-E, un’intelligenza artificiale che genera opere d’arte originali basate su suggerimenti forniti dall’uomo che possono letteralmente essere semplici come “l’immagine di un treno”. Mentre digita le parole per creare un’immagine dopo l’altra, il oh! è tornato. Solo che questa volta non se ne va. “Sembra un miracolo”, ha detto dice. “Quando sono apparsi i risultati, mi è mancato il fiato e mi sono venute le lacrime agli occhi. È così magico.
Le nostre macchine hanno varcato una soglia. Per tutta la vita, siamo stati rassicurati sul fatto che i computer non erano in grado di essere veramente creativi. Eppure, improvvisamente, milioni di persone stanno ora utilizzando una nuova generazione di IA per generare immagini straordinarie e mai viste prima. La maggior parte di questi utenti non sono, come Lee Unkrich, artisti professionisti, e questo è il punto: non devono esserlo. Non tutti possono scrivere, dirigere e modificare un premio Oscar come Storia del giocattolo 3 oro noce di coccoma tutti Potere avvia un generatore di immagini AI e digita un’idea. Ciò che appare sullo schermo è sbalorditivo per realismo e profondità di dettaglio. Così la risposta universale: oh!. Solo su quattro servizi, Midjourney, Stable Diffusion, Artbreeder e DALL-E, gli esseri umani che lavorano con le IA ora cocreano più di 20 milioni di immagini ogni giorno. Con un pennello in mano, l’intelligenza artificiale è diventata un motore di wow.
Poiché queste IA che generano sorprese hanno imparato la loro arte da miliardi di immagini realizzate da esseri umani, il loro output si aggira intorno a come ci aspettiamo che le immagini siano. Ma poiché sono un’intelligenza artificiale aliena, fondamentalmente misteriosa anche per i loro creatori, ristrutturano le nuove immagini in un modo che nessun essere umano potrebbe pensare, riempiendo dettagli che la maggior parte di noi non avrebbe l’abilità artistica di immaginare, per non parlare delle abilità eseguire. Possono anche essere istruiti a generare più variazioni di qualcosa che ci piace, in qualunque stile vogliamo, in pochi secondi. Questo, in definitiva, è il loro vantaggio più potente: possono creare cose nuove che sono riconoscibili e comprensibili ma, allo stesso tempo, completamente inaspettate.
Queste nuove immagini generate dall’intelligenza artificiale sono così inaspettate, infatti, che, nel silenzioso stupore che segue immediatamente il oh!– un altro pensiero viene in mente a quasi tutti coloro che li hanno incontrati: l’arte creata dall’uomo deve ora essere finita. Chi può competere con la velocità, l’economicità, le dimensioni e, sì, la creatività sfrenata di queste macchine? L’arte è ancora un’altra ricerca umana che dobbiamo cedere ai robot? E la prossima domanda ovvia: se i computer possono essere creativi, cos’altro possono fare che ci è stato detto che non potevano?
Ho trascorso gli ultimi sei mesi usando le IA per creare migliaia di immagini sorprendenti, spesso perdendo una notte di sonno nella ricerca senza fine per trovare solo un altro bellezza nascosta nel codice. E dopo aver intervistato i creatori, gli utenti esperti e altri primi utilizzatori di questi generatori, posso fare una previsione molto chiara: l’IA generativa cambierà il modo in cui progettiamo praticamente tutto. Oh, e nessun artista umano perderà il lavoro a causa di questa nuova tecnologia.
È no esagerato chiamare immagini generate con l’aiuto dell’intelligenza artificiale co-creazioni. Il segreto che fa riflettere di questo nuovo potere è che le sue migliori applicazioni sono il risultato non della digitazione di un singolo prompt ma di conversazioni molto lunghe tra umani e macchine. Il progresso per ogni immagine deriva da molte, molte iterazioni, avanti e indietro, deviazioni e ore, a volte giorni, di lavoro di squadra, tutto sulla scia di anni di progressi nell’apprendimento automatico.
I generatori di immagini AI sono nati dall’unione di due tecnologie separate. Una era una linea storica di reti neurali di deep learning in grado di generare immagini realistiche coerenti e l’altra era un modello di linguaggio naturale che poteva fungere da interfaccia per il motore di immagini. I due sono stati combinati in un generatore di immagini basato sul linguaggio. I ricercatori hanno cercato su Internet tutte le immagini che avevano testo adiacente, come le didascalie, e hanno utilizzato miliardi di questi esempi per collegare le forme visive alle parole e le parole alle forme. Con questa nuova combinazione, gli utenti umani potevano inserire una stringa di parole, il prompt, che descriveva l’immagine che cercavano e il prompt generava un’immagine basata su quelle parole.
.