Tärkeimmät oppimispisteet
- DALL·E on uusi hermoverkko, joka voi piirtää kuvia tekstistä.
- Verkko on yksi kasvava määrä tekoälyprojekteja, jotka voivat jäljitellä ihmisten luovaa tulosta.
- Asiantuntijat sanovat, että tekoälyn piirtämät kuvat eivät ole alkuperäisiä luomuksia.
Big datan käyttö kuvien tuottamiseen
Tekoälytutkimusyrityksen OpenAI:n luoma DALL-E kerää valtavia määriä dataa Internetistä. Tiedot käsitellään sitten luonnollisen kielen mallilla ja opetetaan tuottamaan kuvia tekstistä. DALL-E toimii samalla tavalla kuin äskettäin julkaistu GPT-3, OpenAI:n luoma kielimalli, jota voidaan pyytää luomaan alkuperäisiä tekstikohtia. GPT-3 on koulutettu puoleen biljoonaan sanaan Internet-tekstiä ja se voi tuottaa yllättävän todenmukaista tekstiä. «Koneen opettaminen ymmärtämään kieltä tarpeeksi hyvin kuvan luomiseksi on erittäin tärkeä saavutus.» Michael Yurushkin, tietotiedeyrityksen BroutonLabin perustaja ja teknologiajohtaja, sanoi sähköpostihaastattelussa, että DALL-E on «yksi ihmiskunnan harvoista onnistuneista yrityksistä jäljitellä luovuuttamme ja mielikuvitustamme». Hän lisäsi: «On helpompi ymmärtää, kuinka tekoäly ennustaa jotain käymällä läpi asiaankuuluvia tietoja, mutta on vaikeampaa ymmärtää, kuinka se voi luoda piirustuksia asioista, joista se ei ole koskaan ennen kuullut.» Schwartz on erittäin varovainen, ettei tekoäly luo tietoa, vaan käyttää kielidataa ja muuntaa sen kuviksi. «Alkuperäinen luovuus tulee ihmiseltä, joka rakensi tehtävän», Schwartz sanoi. «Tekoälyssä on jonkin verran «luovuutta», kun se kokeilee erilaisia datayhdistelmiä ja valitsee sitten useista mahdollisista tulosteista. Ihminen kuitenkin tutkii tuotoksia ja opettaa tekoälyä valitsemaan monista yhdistelmistä. .»
Robottietsivätyö?
Kone voi kokeilla tätä datan ja objektien yhdistelmää paljon nopeammin kuin taiteilija ihminen. Schwartz huomautti, että DALL-E saattaa jonain päivänä tehdä yhteistyötä etsivän kanssa, joka yrittää rekonstruoida rikospaikan luonnoksesta silminnäkijöiden kertomusten perusteella. «Silloin kun todistajat antavat lausuntojaan, tietokone voi ottaa puhutun, luonnollisen kielen tiedon ja tehdä piirustuksen paikasta tai useita piirroksia paikasta», hän sanoi. «Nämä visualisoinnit voidaan sitten yhdistää luomaan tarkempi kuva kadonneista todisteista. Tätä visualisointia voidaan rikastaa yhdistämällä aiemmat kuvat rikosta edeltäneestä sijainnista.» Useat muut tekoälyohjatut ohjelmat voivat tuottaa taidetta. Esimerkiksi Ai-Da käyttää taiteen luomiseen robottikäsijärjestelmää ja kasvojentunnistustekniikkaa yhdistettynä tekoälyyn. Järjestelmä pystyy analysoimaan koneen eteen sijoitettua kuvaa, joka syötetään algoritmiin, joka tuottaa robotin käsivarren liikkeet. Ihmistaiteilijoiden ei kuitenkaan tarvitse huolehtia siitä, että robottiherrat korvaavat heidät, Rutgersin yliopiston Art and Artificial Intelligence Labin johtaja Ahmed Elgammal väitti The New York Timesissa viime vuonna. «Vaikka taiteen määritelmä kehittyy jatkuvasti, se on ytimessä ihmisten välisen kommunikoinnin muoto», hän kirjoitti. «Ilman ihmisen taiteilijaa koneen takana, tekoäly ei voi tehdä paljon muuta kuin leikkiä muodolla, oli kyseessä sitten näytön pikselien manipulointi tai nuottikirjan nuottien käsittely. Nämä toiminnot voivat olla kiehtovia ja havainnollisesti kiehtovia, mutta niillä ei ole merkitystä. ilman taiteilijan ja yleisön välistä vuorovaikutusta.» DALL-E:n töiden tarkastelun jälkeen ymmärrän Elgammalin pointin, että tekoälyn luomat kuvat eivät ole taidetta. Toisaalta ne ovat parempia kuin mikään taide, jonka voisin tehdä. Joten todella, mitä eroa on?