Ključni izsledki
- DALL·E je nova nevronska mreža, ki lahko riše slike na podlagi besedila.
- Omrežje je eden od vedno večjega števila projektov umetne inteligence, ki lahko posnemajo ustvarjalne rezultate ljudi.
- Strokovnjaki pravijo, da slike, ki jih je narisala umetna inteligenca, niso izvirne stvaritve.
Premakni se, Picasso. Nova nevronska mreža lahko riše slike na podlagi besedila.
DALL·E, kombinacija imen umetnika Salvadorja Dalíja in Pixarjevega WALL·E, lahko sprejme poljubno besedilo in iz njega ustvari sliko. Sistem uporablja nevronsko mrežo, ki je bila naučena na milijardah slik in besedilnih primerov. To je eden od vedno večjega števila projektov umetne inteligence, ki lahko posnemajo, vendar ne posnemajo ustvarjalnega rezultata ljudi.
"Ker se naravni jezik nenehno razvija in je zelo odvisen od kontekstualnih nians, je naučiti stroj, da razume jezik dovolj dobro, da nariše sliko, zelo pomemben dosežek," Tamara Schwartz, profesorica kibernetske varnosti na York College of Pennsylvania, je dejal v intervjuju po elektronski pošti. "Predstavljajte si policijskega skičarja, to je redek talent, ki ima sposobnost ustvariti sliko na podlagi opisa priče."
Uporaba velikih podatkov za izdelavo slik
DALL-E je ustvarilo podjetje za raziskave umetne inteligence OpenAI in deluje tako, da zbira ogromne količine podatkov iz interneta. Podatke nato obdela model naravnega jezika in jih usposobi za ustvarjanje slik iz besedila. DALL-E deluje podobno kot nedavno izdani GPT-3, jezikovni model, ki ga je ustvaril OpenAI, ki ga je mogoče pozvati, da ustvari izvirne odlomke besedila. GPT-3 je bil usposobljen za uporabo pol trilijona besed internetnega besedila in lahko proizvede presenetljivo realistično besedilo.
Naučiti stroj razumeti jezik dovolj dobro, da nariše sliko, je zelo pomemben dosežek.
Michael Yurushkin, ustanovitelj in tehnični direktor BroutonLab, podjetja za podatkovno znanost, je v intervjuju po elektronski pošti dejal, da je DALL-E "eden redkih uspešnih poskusov človeštva pri posnemanju naše ustvarjalnosti in domišljije." Dodal je: "Lažje je razumeti, kako umetna inteligenca nekaj napove s pregledovanjem ustreznih podatkov, vendar je težje razumeti, kako je sposobna ustvariti risbe iz stvari, za katere prej nikoli ni 'slišal'."
Schwartz pozorno ugotavlja, da umetna inteligenca ne ustvarja informacij, temveč prejme jezikovne podatke in jih pretvori v slike.
"Začetna ustvarjalnost izvira iz človeka, ki je sestavil nalogo," je dejal Schwartz. "Umetna inteligenca je nekaj 'ustvarjalne', ker eksperimentira z različnimi kombinacijami podatkov in nato izbira med številnimi možnimi rezultati. Vendar pa človek pregleduje rezultate in umetno inteligenco uči, kako izbrati med številnimi kombinacijami."
Robotsko detektivsko delo?
Stroj lahko eksperimentira s kombinacijo teh podatkov in predmetov veliko hitreje kot človeški umetnik. Schwartz je opozoril, da bi lahko DALL-E nekega dne sodeloval z detektivom, ki bi poskušal rekonstruirati kraj zločina s pomočjo skice na podlagi pričevanja očividcev.
"Ko priče dajo svoje izjave, lahko računalnik vzame te govorjene informacije v naravnem jeziku in ustvari risbo prizora ali več risb prizora," je rekla. "Te vizualizacije bi lahko nato integrirali, da bi ustvarili natančnejšo podobo izgubljenih dokazov. To vizualizacijo bi lahko obogatili z integracijo prejšnjih posnetkov lokacije pred zločinom."
Več drugih programov, ki jih poganja AI, lahko ustvari umetnost. Ai-Da na primer uporablja sistem robotske roke in tehnologijo za prepoznavanje obraza v kombinaciji z umetno inteligenco za ustvarjanje umetnosti. Sistem lahko analizira sliko, postavljeno pred stroj, ki se vnese v algoritem za ustvarjanje gibov robotove roke.
Vendar pa človeških umetnikov ne bi smelo skrbeti, da jih bodo nadomestili robotski vladarji, je lani v The New York Timesu trdil Ahmed Elgammal, direktor laboratorija za umetnost in umetno inteligenco na univerzi Rutgers.
"Čeprav se definicija umetnosti nenehno razvija, je v svojem bistvu oblika komunikacije med ljudmi," je zapisal. "Brez človeškega umetnika za strojem lahko umetna inteligenca naredi komaj kaj več kot igranje z obliko, ne glede na to, ali to pomeni manipulacijo s slikovnimi pikami na zaslonu ali zapiski v glasbeni knjigi. Te dejavnosti so lahko privlačne in zaznavno intrigantne, vendar nimajo pomena brez interakcije med umetnik in občinstvo."
Po ogledu dela DALL-E razumem Elgammalovo stališče, da slike, ustvarjene z umetno inteligenco, niso umetnost. Po drugi strani pa so boljši od katerekoli umetnosti, ki bi jo lahko ustvaril. Torej, res, kakšna je razlika?