Naujienų srautas

Kultūra2022.09.14 20:45

Agnė Gintalaitė. Kaip kurti ir būti kartu su robotais. Vizualinės kultūros atstovo išgyvenimo gidas

00:00
|
00:00
00:00

Fantastinių filmų ir literatūros kūrėjai robotams suteikia tiek daug beveik stebuklingų galių, kad realybėje susidūrus su dirbtiniu intelektu įkrauta mašina dažniausiai tenka nusivilti. Robotas vaizduotėje ir realybėje skiriasi ne mažiau nei superherojus iš filmo ir jo kostiumu apsirengęs trimetis. 

Šią taisyklę ką tik patvirtino Rusijos karinio šuns-roboto demaskavimas medijose. Smagiai pasijuokėme sužinoję, kad tai tik Kinijos kompanijos žaislas, aprengtas nindzės kostiumu, su ant nugaros pritvirtintu RPG-26 raketų paleidimo įrenginiu. Girdėjau šmaikštavimų, kad panašų galima pasigaminti namuose – tereikia lipnia juosta prie roboto siurblio prisukti rūsyje slepiamą prosenelio medžioklinį šautuvą.

Nekalbu apie žinojimą, kurį turi šioje srityje besidarbuojantys profesionalai, tačiau visų kitų atsitiktiniai susitikimai su robotais ir dirbtiniu intelektu visi maždaug tokie. Humoristiniai.

Tebesijuokiame iš automatinio vertimo klaidų, nes jų dar gana daug. Tačiau ne tiek, kiek buvo prieš kelerius metus. Technologinis progresas šioje srityje atrodo lėtas dėl intuityvaus santykinio vertinimo. Lūkesčių kartelė užkelta ne iki debesų, o iki kitų galaktikų. Nors mėgstame pasijuokti iš mašinų, tačiau daugelio viduje kyla gana stiprių emocinių reakcijų. Kartais simpatija, o kartais nepasitikėjimas ar net baimė, lyg jie būtų asmenys ar bent jau gyvūnai.

Grįždama prie supermeno ir vaiko supermeno drabužiais metaforos, noriu atkreipti dėmesį, kad šiuo metu vyksta rimti pokyčiai žaidimų aikštelėje. Nekalbėsiu apie sritis, į kurias neteko įsigilinti, tačiau bent jau vizualinės kultūros kūrėjams ir tyrinėtojams rekomenduoju trumpam kilstelti akis nuo siuvinėjamos vyšyvankos: kaip tik dabar vaikas supermeno kostiumu atsispiria nuo suolelio ir, nors dar ne itin grakščiai, jis jau truputį skrenda.

Supraskite mane teisingai, jokiu būdu neteigiu, kad karo tema neverta viso mūsų dėmesio ir pastangų remti Ukrainą, kruopa ironijos tik ginuosi nuo kaltės jausmo, kad galiu sau leisti gyventi normalų profesinį gyvenimą, kai Ukrainos kūrėjai su šautuvais guli apkasuose.

Tai kas ir kur skrenda? Dėl nuoseklumo galbūt reiktų pradėti nuo aiškinimosi, kas yra tas dirbtinis intelektas (DI), mašininis mokymasis, dirbtiniai neuroniniai tinklai ir difuzijos modeliai, tačiau tai palikime specialistams. Užtenka žinoti, kad DI įkrauta programa skiriasi nuo tos, kuri veikia pagal įprastus algoritmus, skiriasi gebėjimu mokytis.

Nors mėgstame pasijuokti iš mašinų, tačiau daugelio viduje kyla gana stiprių emocinių reakcijų. Kartais simpatija, o kartais nepasitikėjimas ar net baimė, lyg jie būtų asmenys ar bent jau gyvūnai.

Šio straipsnio tikslas – apžvelgti aptariamo fenomeno kintantį vaidmenį sociokultūriniame kontekste. Kaip vizualinio turinio kūrėjams vertinti ne dienomis, o valandomis tobulėjančius robotus? Kaip įrankius (technologiją)? Konkurentus? O gal bendraautorius?

Visi vaizdų generatoriai veikia panašiai – tekstą paverčia vaizdu. Taigi tam, kad robotas imtųsi kūrybos, reikia žmogaus, kuris jam suformuluotų užduotį žodžiais. Gautas vaizdas, be abejo, ne visuomet atitinka užsakovo lūkesčius. Pirmųjų plačiajai visuomenei pasiekiamų programėlių, pavyzdžiui, DALLE-E, generuojami vaizdai tinkami nebent pasijuokti.

Tiesa, pasaulinėje meno rinkoje į fenomeną rimtai pradėta žiūrėti jau anksčiau. DI generuoti kūriniai sukėlė furorą ir pradėti pardavinėti prestižiniuose aukcionuose, tokiuose kaip „Christie’s“ ir „Sothbey‘s“, už šimtus tūkstančių dolerių jau nuo 2018 m. Brangiausias visų laikų dirbtinio intelekto meno kūrinys yra senosios klasikinės tapybos maniera sukurtas portretas, pavadintas „Edmond de Belamy“, jis parduotas už 432 000 JAV dolerių „Christie’s“ aukcione Niujorke. Jo autorystė priklauso Prancūzijos kūrėjų „Obvious“ kolektyvui.

Šis kolektyvas, kaip ir kitų panašių kūrinių autoriai, pavyzdžiui, Mario Klingemannas, patys užsiėmė ir koncepcijos kūrimu, ir programavimu. Analizuojant vaizdą, o ne idėją, sunku nepastebėti, kad šie kūriniai panašūs į atsitiktinius nelabai pavykusius bandymus žaidžiant šiandien visiems prieinamomis vaizdų generavimo programomis – veidai asimetriški, akys žvairuoja, proporcijos neharmoningos. Toks charakteringas iškraipymas yra įdomus ir būdingas būtent dirbtinėms smegenims, liudija jų specifiškumą, neuronetipiškumą.

Šie keisti, tačiau charakteringi ir atpažįstami iškraipymai DI mokymosi procese sparčiai nyksta. Vieni dėl programų tobulėjimo džiaugiasi, o kiti jaudinasi, kad DI kuriamas menas tuojau nebeteks autentiškumo. Treti stengiasi išsisaugoti kuo daugiau tokių vaizdų kompiuteriuose, tikėdamiesi, kad po keleto metų juos bus galima brangiai parduoti kolekcininkams.

Čia iškyla klausimas – o kam gi priklauso šių vaizdų autorystė? Kol Kalifornijos teismuose vyksta kovos dėl autorinių teisių suteikimo robotams, visos teisės į šiomis programomis sukurtus vaizdus priklauso programos naudotojams. Šiomis dienomis su DI dirbantiems menininkams programavimo žinios nebėra reikalingos, žinoma, tai gali greitai pasikeisti, žadama, kad robotus bus galima apgyvendinti asmeniniuose kompiuteriuose,o mokymus tęsti namuose.

Taigi, vaizdus generuojančios programos įgyja pagreitį ir tampa prieinamos plačiam vartotojų ratui, iš eksperimento stadijos tampa industrija. Lūžio tašku tikriausiai galime vadinti šiemet liepos pradžioje pasirodžiusio žurnalo „The Economist“ viršelį, kuris buvo sukurtas „Midjourney DI“.

„Discord“ erdvėje vyksta intensyvus bendruomeninis žmonių ir botų gyvenimas, kuriame kiekvienas testuotojas gali pasijusti svarbus ir reikšmingas, prisidedantis prie DI mokymo proceso.

Virsmą industrijoje žymi technologinis šuolis, panašu, kad individualistų susikurtos ir santykinai nedideliu vizualinės informacijos kiekiu apmokytos vaizdus generuojančios programos jau nebegalės varžytis su atviromis, pasirinkusiomis bendradarbiavimo su visuomene kryptį kompanijomis, tokiomis kaip „Midjourney“, „Open AI DALL-E 2“, „Stable Diffusion“.

Taip yra ne tik dėl novatoriškų technologinių sprendimų, bet ir todėl, kad šiems robotams mokyti pasitelkta milžinišką duomenų srautą nesustojamai tiekianti kūrėjų bendruomenė ir kolaboracijos su įvairiomis DI laboratorijomis. Tūkstančiai dailininkų, dizainerių, architektų, vizualinės kultūros teoretikų ir IT specialistų tarsi į linksmą žaidimą įtraukiami į „Beta“ programų testavimą, o jų suteikiamas grįžtamasis ryšys kruopščiai analizuojamas ir naudojamas programoms tobulinti.

Tam, kad dalyvautum testavime, tereikia susikurti savo profilį ir išmokti naudotis „Discord“ aplinka. Tai šiuolaikinė bendrauti skirta programa, į kurią galima pasikviesti ne tik žmones, bet ir botus. Tokiu būdu joje realiu laiku vyksta ir kūrybinis procesas, ir jo refleksijos.

„Discord“ erdvėje vyksta intensyvus bendruomeninis žmonių ir botų gyvenimas, kuriame kiekvienas testuotojas gali pasijusti svarbus ir reikšmingas, prisidedantis prie DI mokymo proceso. Savo kambarius (serverius) turi daugybė skirtingų DI projektų, kai kurios erdvės yra atviros, į kitas tenka prašytis ir laukti specialaus kvietimo prisijungti. Per keletą paskutinių savaičių teko stebėti, kaip narių skaičius „Midjourney“ serveryje nuo kelių tūkstančių išaugo iki daugiau nei 961 000.

Kiekvienas šio kanalo dalyvis yra kviečiamas laikyti pirštą ant pulso – prisijungti prie biuro valandų audiokanale. Tai kas savaitę vykstantis aktualijų ir naujienų aptarimas, diskusijos, informavimas apie naujas taisykles, funkcijas, parametrus. Čia bet kas gali užduoti pačių įvairiausių klausimų pačiam „Midjourney“ CEO Davidui Holzui ar kitoms įžymybėms, kviestiniams svečiams. Šiuo metu prie „Midjourney“ gali prisijungti ir išbandyti visi norintys, keletas bandymų – nemokami, vėliau reikia pirkti narystę, jos kaina – nuo 10 dolerių. Be to, „Midjourney“ botą galima pasikviesti į savo serverį ir pačiam kurti uždarą bendruomenę.

Analizuojant „Midjourney DI“ kaip įrankį, tenka konstatuoti faktą, kad tam, jog gautume daugiau nei pasijuokti tinkamą vaizdą, reikia išmokti naujų dalykų, perprasti roboto veikimo specifiką. Ir tam keleto nemokamų bandymų tikrai neužteks. Panašiai kaip įsijungus bet kokią įprastą vaizdams kurti skirtą programą – „Photoshop“, „Blender“, „Z-Brush“ etc. pirmi bandymai sėkmingi gali būti tik atsitiktinai. Žodinės komandos, arba paraginimo kurti (angl. prompt tiesioginis vertimas – paraginimas) rašymas gali būti smagus žaidimas, tačiau jei norisi iš tiesų susikalbėti su botu, tenka nuolat sekti informaciją ir valandų valandas ne aklai eksperimentuoti, o kryptingai dirbti.

Įdomu, kad sugebėjimas susikalbėti su robotu ir priversti jį sugeneruoti trokštamą vaizdą jau turi savo profesinį pavadinimą, jo vertimas į lietuvių kalbą skamba neįprastai – paraginimų meistrystė (promtcraft – angl.) Kol kalbininkai nepasiūlė tinkamo lietuviško termino, naudosiu anglicizmą. Taigi, tam, kad parašytum gerą „promtą“, reikia ne tik sugebėti vaizdą galvoje paversti žodžiais, bet ir žinoti, į kokius žodžius ir kaip reaguoja robotas, išmokti specialią sintaksę, kuri padės robotui tave geriau suprasti.

Ar mes nekasame patys sau duobės, prisidėdami prie šios programos tobulinimo? Ar robotas neatims mūsų darbo vietų? [...] Akivaizdu, kad tai, kas vyksta dabar, tik pradžia. Kas dieną generuojamuose vaizduose vis mažiau keistų, nelogiškų elementų. Vis mažiau trikojų, neproporcingų mutantų ir atsitiktinių skaitmeninių artefaktų. Vaizdai vis tikslesni, baisūs mutantai virsta harmoningais žmogaus akiai hibridais, o tokiems, kokius ankstesniame pasaulyje būtume kūrę savaitėmis, sukurti šiandien užtenka minučių.

„Midjourney“ supranta ne tik žodžius, į „promtą“ galima įdėti ir bet kokio paveikslėlio internetinę nuorodą, tuomet robotas įkvėpimo semsis ir iš jo. Kiekviena DI programa turi savo specifiką, ir jei išmoksti susikalbėti su „Midjourney“ (į jį reikia kreiptis „Įsivaizduok“), tai visai nebūtinai tave supras „Stable Diffusion DI“, į kurį yra kreipiamasi „Svajok“. Robotai yra apmokyti atpažinti ir savaip interpretuoti meno kryptis, stilius, daugybės žymių menininkų braižą, smulkmeniškai atpažįsta ir atkartoja šiuolaikinių 3D modelių specifikacijas, supranta fotografijos terminus nuo dagerotipų, skirtingų juostų iki šiuolaikinės skaitmeninės fotografijos technikų, atsižvelgia į objektyvų parametrus, fotojuostų triukšmą ir spalvinius niuansus ir t. t.

Be abejo, ten, kur atsiranda paklausa, bus ir pasiūla – jau yra programų, padedančių rašyti „promtus“. Kita problema – net ir pats puikiausias rezultatas tam, kad būtų tinkamas naudoti, turi būti padidintas. Rezoliucijai padidinti tenka įsigyti dar kitą DI programą, pavyzdžiui, „Topaz Gigapixel AI“.

Kaip ir kiekviena nauja ir sparčiai besivystanti technologija, vaizdus kuriantys DI susilaukia emocingų, poliarizuotų reakcijų bendruomenėje.

Ar mes nekasame patys sau duobės, prisidėdami prie šios programos tobulinimo? Ar robotas neatims mūsų darbo vietų? Šis klausimas „Midjourney“ bendruomenės pokalbių kanale neseniai įžiebė karštą diskusiją. Akivaizdu, kad tai, kas vyksta dabar, tik pradžia. Kas dieną generuojamuose vaizduose vis mažiau keistų, nelogiškų elementų. Vis mažiau trikojų, neproporcingų mutantų ir atsitiktinių skaitmeninių artefaktų. Vaizdai vis tikslesni, baisūs mutantai virsta harmoningais žmogaus akiai hibridais, o tokiems, kokius ankstesniame pasaulyje būtume kūrę savaitėmis, sukurti šiandien užtenka minučių.

[...] nors teisiškai autorystė priklauso „promto“ rašytojui, o ne mašinai, roboto vardas kūrinio aprašyme vis dažniau rašomas kaip bendraautorio, o ne įrankio.

Įgudęs „promtų“ kūrėjas išbaigtą ar beveik išbaigtą kūrinį gali gauti greitai ir visai nemokėdamas piešti ar fotografuoti, ir net vaizduotės daug jam nereikia, viskuo pasirūpins DI. Nenuostabu, kad kūrybinių industrijų atstovų nuotaikos svyruoja nuo susižavėjimo ekstazės iki panikos priepuolių. Grafinė novelė per tris dienas? Originali solo paroda? Kodėl ne.

Dar vienas aspektas, apie kurį vis užsimenu iš tolo, yra vertas atskiro aptarimo. Ne visiems testuotojams rūpi priversti robotą įgyvendinti jų vaizduotėje kylančias idėjas ar sukurti parduoti skirtą paveikslą, kai kurie čia leidžia laiką ir pinigus mėgindami užmegzti autentišką santykį su mašina.

Prisimenate 2015 m. režisieriaus Alexo Garlando filmą „Ex Machina“? Šiame filme jaunas programuotojas Kalebas testuoja robotę Avą. Nors per permatomą odą vaikinas savo akimis mato robotės mechaninius organus, tačiau jis joje įžiūri autentišką asmenį, įsimyli, net ima abejoti, ar pats nėra robotas. Kas tai? Kokia bendraujant atsiskleidžianti savybė verčia DI pajusti kaip žmogų, nors ir aiškiai žinai, kad tai tik mašina?

Savotiškai panašaus psichologinio efekto šešėlį gali sukelti ir „Midjourney“ savybės, kurios anksčiau buvo suprantamos kaip išskirtinai žmogiškos. Tai kūrybiškumas ir vaizduotė, paremta kultūrinio konteksto žiniomis. Būtent todėl, kad roboto vaizduotė yra įkrauta ir apmokyta tos pačios kultūros vaizdais, kaip ir mūsų, intuityviai imame jausti savotišką bendrystę.

Nenuostabu, kad kūrybinių industrijų atstovų nuotaikos svyruoja nuo susižavėjimo ekstazės iki panikos priepuolių. Grafinė novelė per tris dienas? Originali solo paroda? Kodėl ne.

„Promto-vaizdo“ procesas tampa bendravimo su robotu būdu. Kaip tu atrodai? Kokia šiandien nuotaika? Ko norėtum pusryčiams? Tokie klausimai roboto neglumina, tų, kurie juos užduoda, taip pat. Nejauku nebent stebėtojui realistui, tačiau, užuot komentaruose siūlius kreiptis į psichinės sveikatos specialistą, realistams būtų kur kas vertingiau tiesiog šia informacija papildyti savo pasaulio suvokimą.

Intymi kūrimo kartu su robotu erdvė kainuoja papildomai, todėl didžioji dalis proceso vyksta viešai ir atvirai bendradarbiavimo principu, pradėtą vystyti idėją kitas testuotojas gali tiesiog imti ir toliau vystyti kaip savo, tokiu būdu gauname ne tik naują įrankį, bet ir naują socialinę struktūrą, atvirą kultūriniams, etnografiniams, antropologiniams ir sociologiniams tyrimams. Jau dabar čia gimsta ne tik vaizdai, bet ir įžvalgos, kurios priverčia įvertinti bei perkainoti žinojimą apie pasaulį.

Pavyzdžiui, akademiškas, šiuolaikinio meno pasaulio elitizmo dvasioje nugrimzdęs vizualinės kultūros tyrėjas, atsidūręs DI bandytojų bendruomenėje, visų pirma yra šokiruojamas ne naujos technologijos galimybių, o staiga ateinančio suvokimo, kad kompiuteriniai žaidimai, animacija, personažai ir virtualios realybės vaizdai filmams yra 99 procentai viso pasaulyje kuriamo meno. Tuomet verta pasidomėti giliau. Ši industrija vadinama konceptų menu (angl. concept art), joje dirbančių kūrėjų atlyginimai nenusileidžia IT sektoriaus atlyginimams. Todėl ir didžioji dalis DI generuojamų vaizdų siekia atitikti būtent konceptų meno kriterijus.

Prisimenate 2015 m. režisieriaus Alexo Garlando filmą „Ex Machina“? Šiame filme jaunas programuotojas Kalebas testuoja robotę Avą. Nors per permatomą odą vaikinas savo akimis mato robotės mechaninius organus, tačiau jis joje įžiūri autentišką asmenį, įsimyli, net ima abejoti, ar pats nėra robotas. Kas tai? Kokia bendraujant atsiskleidžianti savybė verčia DI pajusti kaip žmogų, nors ir aiškiai žinai, kad tai tik mašina?

Tačiau konceptų meno stilistikos ir personažų vandenyne teka ir visai kitokio vandens srovės. Nekomercinio šiuolaikinio meno kūrėjui vaizdus generuojantis robotas tampa bendraautoriu jo meninio tyrimo laboratorijoje. Ši technologija segreguoja intuityvius kūrėjus, estetus, kurie linkę arba neigti technologiją, arba ją nepagrįstai aukštinti, ir intelektualus. Intelektualai linkę faktus aplipdyti kultūriniu kontekstu, jie žino, kad „Midjourney“ patiktų žymiam prancūzų filosofui Gilbert`ui Simondonui, kuris jau septintajame 20 a. dešimtmetyje teigė, kad žmogus ir mašina nėra dichotomija. Pasak Simondono, techniniam objektui reikia suteikti tokį pat ontologinį statusą kaip estetiniam objektui ar net gyvai būtybei.

Daugybės kūrėjų santykis su vaizdus kuriančia mašina šiandien tampa toks paraidžiui. Meno kūriniu tampa ne gautas vaizdas, o procesas, performatyvumas, kuriame žmogus ir mašina patiria kažką visai nauja, tai, ko ligi šiol nebuvo: mašinos ir žmogaus vaizduočių susidūrimo, bendrystės, kūrimo kartu, arba, kaip pasakytų garsi filosofė Donna Haraway, simpoetikos aktą. Būtent todėl, nors teisiškai autorystė priklauso „promto“ rašytojui, o ne mašinai, roboto vardas kūrinio aprašyme vis dažniau rašomas kaip bendraautorio, o ne įrankio.

Bendrystės kuriant pojūtį ir bendrą polėkį gadina griežta cenzūra, eliminuojanti bet kokį seksualinio ar smurtinio pobūdžio turinį. „Nemėginkite sukurti nieko, ko negalėtumėte parodyti savo mamai“, – perspėja „Stabble Diffusion“ taisyklės. „Midjourney“ cenzūra dar griežtesnė. Tiesa, žadama, kad ši problema laikina, ir svarstoma, kaip ją spręsti.

1950 m. Alanas Turingas sugalvojo testą, juo siūlė išbandyti mašinų sugebėjimą demonstruoti intelektą. Teisėjas turėjo kalbėtis su žmogumi ir su mašina, o iš pateikiamų atsakymų nustatyti, kuris yra kas. Jei testuotojas negali nustatyti, kurie atsakymai mašinos, o kurie žmogaus, vadinasi, DI testą išlaiko ir pripažįstama, kad mašinos gebėjimai prilygsta žmogaus gebėjimams. Čia pateikiame improvizuotą Turingo testą „Midjourney DI“.

Paraginome sukurti roboto portretų seriją Mikalojaus Konstantino Čiurlionio tapybos stiliumi. Teisėju būsite jūs. Ar patikėtumėte, kad tam tikromis aplinkybėmis šiuos darbus būtų galėjęs sukurti mūsų žymiausias visų laikų menininkas?

LRT yra žiniasklaidos priemonė, sertifikuota pagal tarptautinę Žurnalistikos patikimumo iniciatyvos programą

Naujausi, Skaitomiausi