Automatic translation by Google Translate.We cannot guarantee that it is accurate.

Skoða vefinn á Íslensku

Skapandi gervigreind: nokkur orð um sjálfvirka og meðvirka tækni 

  • Þræðir - Tölublað 10
  •  Þórhallur Magnússon 

Þórhallur Magnússon

 

ii lab að kynna hljóðfæri við Sonar festival í Barcelona árið 2024.Mynd 1: ii lab að kynna hljóðfæri við Sonar festival í Barcelona árið 2024. 

 

Verkefnið Intelligent Instruments fékk styrk frá Evrópska rannsóknarráðinu árið 2020. Verkefnið rannsakar áhrif gervigreindar á tónlist framtíðarinnar og mikilvægi þess að tónlistarfólk stýri sjálft hvernig samband þeirra við gervigreindina væri skilgreint og útfært. Markmið verkefnisins er að þróa hljóðfæri með gervigreind sem læra af gögnum tónskálda og hegðun flytjenda, hljóðfæri sem þroskast og þróast og bregðast oft við á óvæntan hátt. Í þessu er fólgin nýlunda þar sem hljóðfærin læra á flytjendur, þróast með þeim og mynda samtal sem yrði spennandi út frá tónlistarlegu og heimspekilegu sjónarhorni. Þegar umsókn rannsóknarinnar var skrifuð var lítið um gervigreind í tónlist almennt, utan við rannsóknarstofur háskólanna og örfárra fyrirtækja, en ljóst var að bylting væri í nánd þegar gervitauganet voru tekin í notkun við framleiðslu listræns efnis. Eitt af framsettum markmiðum verkefnisins var að stunda orðræðugreiningu á viðbrögðum fólks þegar atbeini gervigreindartækninnar fer að hafa veruleg áhrif á tónlistariðkun og þar með varpa almennu ljósi á þessa hlið tækninnar.  

Síðan hefur mikil mjólk runnið úr spenum Auðhumlu. Haustið 2021 lagði Open AI ChatGPT á netið, við miklar undirtektir fólks um allan heim. Hér var komin gervigreind sem loksins gat hugsað eins og manneskja – eða þannig leit það út í fyrstu. Nokkru fyrr hafði Open AI gefið út Jukebox sem gat hermt á sannfærandi hátt eftir tónlist þekktra listamanna, þó að hljómgæðin hafi verið fremur slæm. Allt voru þetta spennandi tilraunir sem satt best að segja vöktu undrun sérfræðinga í gervigreind og komu þeim á óvart. Þessi nýja spunagreind (e. generative AI) var nú farin að framreiða texta, myndir og hljóð og það var jafnvel talað um að hún væri farin að “skapa”. Skapandi gervigreind (e. creative AI) hefur einmitt verið ein af helstu áskorunum gervigreindarfræða, því ef kalla ætti þessa greind á einhvern hátt mannlega, þá þyrfti hún að búa yfir helstu gáfu manndýrsins: sköpunargáfunni.  

Á örfáum árum erum við nú orðin vön því að textar, myndir og tónlist renni úr mál-, mynd- og tónlistarlíkönum, og í þeim gæðum að oft er erfitt að greina hvort að manneskja eða vél standi að baki verkinu, s.s. ChatGPT, Deepseek, Perplexity og fleiri forrit í textagerð, Midjourney, Dall-E í myndum, og Suno, Udio eða Stable Audio í tónlistargerð. Fyrirtækin að baki þessum “þjónum” hafa sogað inn í sig hugverk fólks – oft með ólöglegri niðurhalningu á höfundarréttarvörðu efni – og hafa nú reitt fram pródúkt sem framleiðir gerviefni (e. synthetic media), okkur ýmist til ágægju eða hryllings. Þessi sjálfvirka framleiðsla á gerviefni hefur skapað óróa innan skapandi greina og því er haldið fram að hún skerði tekjur listafólks. Staðreyndin er þó sú að okkar síðkapítalíska kerfi er fyrir löngu búið að arðræna hinar skapandi stéttir, þar sem fyrirtæki eins og Spotify eða Storytel streyma efni listafólks án þess að borga því nokkuð fyrir og þá án aðkomu skapandi gervigreindar. Staðan er sú að ef heppnin er með, þá gæti höfundurinn í mesta lagi keypt sér nokkrar karamellur í poka fyrir árslaunin, en ekki margar. Það er hinsvegar ekki við gervigreind að sakast að svona sé komið fyrir verðlagningu og gildi listarinnar. 

Ástæðan fyrir reiði fólks í garð þessa nýja gerviefnis er frekar frumspekileg en efnahagsleg. Ef við rekjum frumspeki sköpunar aftur í tímann, þá mætti byrja á Platón sem taldi sköpun vera endurgerð á heimi hinna fullkomnu frummynda. Nemandi hans, Aristóteles, dró sköpunina niður á jörðina og einbeitti sér að list (gr. tékhnē, τέχνη) sköpunarinnar og hvernig hún gæti göfgað fólk (gr. katharsis, κάθαρσις). Á miðöldum var guð hinn eini skapari og mannleg sköpun átti sér rætur í sköpunarkrafti hans. Í endurreisninni styrktist ímyndin um hinn innblásna listamann og þá magnaðist upp hugmyndin um höfund og höfundarverk. Upplýsingin kom svo með vísindi og fræði, og áhersla var lögð á frumleika. Í rómantíkinni steig hinn innblásni snillingur á svið, eins konar spámaður með tilfinningar upprunnar frá listagyðjum eða öðrum öflum. Guð dó með módernismanum og til varð hugmyndin um undirvitundina, hið dulda og drauma, um leið og leitað var að hreinleika í formi og tjáningu. Í póstmódernismanum var litið svo á að sköpun sé í grunninn tilvísanir í eldri verk, að í tungumálinu hafi allt verið sagt nú þegar, að öll sögn sé endursögn, því að endingu sé það lesandinn sem skapar merkinguna. Í dag erum við í tímabili síðsannleikans (e. posttruth) þar sem list er nýmyndun eða blöndun (e. synthesis) eftirlíkinga, raunveruleikinn er horfinn og nú er litið á sköpun sem tengsl rafrása í blautbúnaði heilans. Jafnframt er því haldið fram að gervigreindin búi yfir huga og – ef ekki nú þegar, þá bráðum – vitund. Ekki er þetta nú sérlega spennandi sýn, en nú er það svo að við hoppum ekki úr einu þekkingarkerfi (e. episteme) yfir í annað og gleymum öllu sem fyrir var. Hugmyndin um hinn innblásna listamann er enn við lýði, að sköpun sé sérkenni mannskepnunnar í einhvers konar ástandi innblásturs sem á sér æðri uppruna. Það sé því hálfgerð móðgun við okkur sem æðstu dýr jarðar (sjá t.d. mannmiðjukenningu kristninnar) að vél geti skapað. Og fólk reiðist. 

“Gervigreindin skilur ekki neitt og veit ekki neitt”, “gervigreindin hefur ekki tilfinningar”, og “gervigreindin er ekki virkur þátttakandi í samfélagi manna” segir fólk þegar það hafnar verkum hennar. Allt eru þetta réttar staðhæfingar. Hvernig getur hún þá skapað eitthvað af viti? Er þetta fjölþætta vit ekki það sem til þarf ef gera á góða list? Ef fyrsta staðhæfingin er þekkingarfræðileg, þá er sú næsta sálfræðileg og hin þriðja félagsfræðileg. Um er að ræða flóknar hugmyndir sem taka á því hvort gervigreindin geti framleitt nokkuð annað en gerviefni. Því að líkönin hafa aldrei reynt neitt, þau hafa ekki skynjað, þau hafa ekki fundið til, aldrei upplifað né speglað sig í samfélagi annarra sem skynja og skilja. Hvernig geta þau tjáð nokkurn skapaðan hlut? Hér liggur goðið grafið: það lítur út, eftir kerfisbundnar rannsóknir okkar í rannsóknarstofunni, að fólki líki ekki við líkingar, eftirlíkingar – því líkar ekki gerviefni. Sumpart vegna þess að árþúsunda frumspeki sköpunar brotnar við framleiðslu gerviefnisins, en aðallega vegna þess að við treystum ekki reynslusögum þess sem ekkert hefur reynt. Jafnvel þó að tónlistarlíki tónlistarlíkananna sé “betra” en ýmislegt sem heyra má á öldum ljósvakans, þá er sú molla samt ákjósanlegri en fölsun vélarinnar.  

Svona er staðan í dag, árið 2025, nánar tiltekið í maí, við lok mánaðar. Við lifum hins vegar á ógnarhraða, á tímum breytilegrar tækni sem einkennast sífellt meir af doða, hugsunarstýringu og skynsemisdauða. Hættan við mállíkön eins og ChatGPT er að við hættum að geta hugsað skýrt og gagnrýnið, að hugsun okkar blandast gervihugsun vélarinnar án þess að við áttum okkur á því. Málið flækist þegar við lítum til þess að pólitísk öfl geta haft áhrif á hugsun vélarinnar með stýringu og ekki lítur það vel út þegar valdamesti stjórnmálamaður heims bullar út í eitt og helmingi fólks virðist standa á sama. Virðing fyrir sannleikanum virðist ekki vera í tísku, heldur fremur að slá um sig með staðhæfingum sem eiga ekki rætur í neinum raunveruleika. Þegar svo raunveruleikinn hverfur í gerviefni sem framleitt er af texta-, mynd- og hljóðvélum byggðum á tölfræði teikna (e. token) í stað táknrænnar hugsunar, og við dveljum í þeim sýndarveruleika að meðaltali átta skjátíma á dag, þá hverfur ef til vill löngunin eftir raunverulegu efni úr raunheimum og gerviefnið fer að nægja. Aðeins framtíðin getur skorið úr um þetta, það er að segja ef það verður einhver mennsk framtíð í framtíðinni. 

En þangað til, og þá í anda andspyrnu og mótspyrnu við ofurkapitalíska gervigreindartækni, þá erum við í Intelligent Instruments Lab að þróa tækni þar sem gervigreindin þjónar okkur listafólki í því sem við gerum, framlengir líkama okkar og huga á persónulegan hátt og býr til andskota (gr. diabolo, sá sem hendir á móti, e. devil) sem okkur þykir gaman að glíma við, spjalla við, kastast á við. Okkur þykir ódýrt að hafna gervigreind í listum af því að hún styggir hugmyndina um hinn skapandi snilling og leikum okkur frekar að því að rannsaka hvernig ný greind verður hluti af tækjum okkar og hugsun á spennandi og gefandi hátt. Í stað sjálfvirkrar gervigreindar þá þróum við meðvirka gervigreind. Það er nefnilega svo að í pósthúmanískum samtíma, þá erum við orðin þreytt á hinni mekanísku heimsmynd módernískra vísinda og fólk sækir í að tengjast jörðinni, hinni deyjandi jörð, á nýjan hátt. Þá er spurt um anda í steinum, lækjum, sveppum, plöntum og dýrum, sem og tengsl okkar, áhrif og ofbeldi í garð þessa. Við speglum okkur í atbeina náttúrunnar og nú er okkur farið að finnast gaman að spegla okkur sem listamenn í atbeina verkfæra til listiðkunar, hvort sem það er penni, pensill eða píanó. Að finna andskotann í verkfærum okkar, hljóðfærunum, er að finna viðmælanda í tækninni, að geta hugsað utan við hugann, eða fremur að hugur okkar flækist (e. entanglement) inn í mekaník hljóðfæranna. Við finnum einnig hvernig tónlistarfólk er að þreytast á hugmyndinni um hinn innblásna rómantíska snilling sem hefur fullkomið vald á hljóðfæri sínu (eftir fasisma 20. aldarinnar sem nú endurhljómar í helstu stórveldum heims er komin viss þreyta á “valdi”) og færist þess í stað í átt að hljóðfærum sem koma á óvart, eru óútreiknanleg, skemmtileg, spennandi og fela í sér áskorun, líkt og nýtaminn gæðingur að vori. Í stað þess að semja verk er tónlistarfólk um allan heim í auknum mæli farið að hanna kerfi sem sett eru fram sem tónverk. Þetta eru ólínuleg kerfi sem krefjast samtals og rannsóknar og hér er gervigreind spennandi tækni. Samtalið við kerfið (hvort sem það er sett fram sem hljóðfæri, tónverk eða innsetning) verður þá rannsókn á möguleikum tjáningar og hugsunar. Það var nefnilega þetta sem Platón áttaði sig á í samræðunni Kratýlos þegar hann fór að skoða orðsifjar orðsins tónlist (gr. mousikḕ, μουσικὴ) að tónlist kemur úr ranni listagyðjanna (gr. moûsai, μοῦσα, e. muses) og að mōsthai (μωσθαι), sem er orðsif listagyðjanna, þýðir í raun rannsókn eða leit. Með hinum nýju hljóðfærum þá erum við að leita, rannsaka, μωσθαι. 

Mannskepnan er tæknileg skepna. Þetta vissu Forngrikkir löngu fyrir uppfinningu rittækninnar og sú þekking var geymd í goðsögum. Það var Prómeþeifur sem gaf okkur eldinn, tæknina, og hún er grunnur að okkar tilvist. Okkar eigin Prómeþeifur, jötuninn Loki, fóstbróðir Óðins, fór oft út fyrir garð guðanna (hann var avant garde) þar sem hann hitti jötna og dverga, og sneri til baka með tækni sem var undirstaða velgengni guðanna. Hér má nefna Mjölni, hamar Þórs; Skíðblaðni, skip Freys; Gungni, spjót Óðins; eða gullið hár Sifjar.  

Tónlist er hin tæknilega list, hljóðfæri hennar hafa verið á meðal þróuðustu tækni hvers sögulegs tímabils, þar sem við tengjumst tækjum er framlengja möguleika líkamans og hugans. Hljóðfæri okkar verða hugfæri og möguleikar hugsunar okkar eru skrifuð inn í hönnun tækninnar. Það er því spennandi að skoða hvernig hin nýja tækni, gervigreindin, getur framlengt hugsun og gerðir í gegnum líkamleg viðmót og hvernig tæknin, enn og aftur, breytir því sem við köllum tónlistun (e. musicking) í dag. Til þess þurfum við heimspeki – og tónlist er hagnýt heimspeki. Eða kannski fremur, eins og Platón segir í Fædros, að heimspeki sé hin æðsta tónlist. 

 

Úr sama tölublaði