Snjallhjóðfæri: að skilja gervigreind 21. aldar í gegnum skapandi tónlistartækni

Þórhallur Magnússon

 

“En þú mundir ekki eiga svona tvær blaðsíður á íslensku eða ensku um Intelligent Instruments til að birta í Þráðum?” spurði Atli Ingólfsson eftir að við áttum samtal nýlega fyrir framan myndavélar í stúdíói Listaháskólans. Tilefnið var Hugarflug, ráðstefna Listaháskólans, þar sem við ræddum fimm ára verkefnið sem Evrópska rannsóknarráðið hefur nýlega styrkt og heitir “Understanding 21st Century AI Through Creative Music Technologies”.[1]

Þræðir er glæsilegt fræðirit tónlistardeildar Listaháskóla Íslands og þetta því gott boð hjá Atla. En ég á engar blaðsíður á íslensku um verkefnið, og meitlaðar setningar rannsóknarverkefnisumsóknar á ensku fræðimáli eru miður skemmtilegar aflestrar, svo að ég ákvað að skrifa litla grein á íslensku. Mér lék forvitni á að vita hvort ég gæti yfir höfuð skrifað á móðurmálinu um þessi mál, að sumu leyti vegna þess að ég hef ekkert skrifað á íslensku í áratugi nema blaður á samfélagsmiðlum. Aðallega þótti mér þó spennandi að sjá hvernig mér gengi að skrifa á íslensku um hugtök eins og “intelligent instruments”, “machine learning”, “creative AI”, og “embodied instrumental agency”. Mér varð hugsað til eins heimspekikennara míns, Þorsteins Gylfasonar, sem hafði eftir Einari Benediktssyni að “orð er á Íslandi til um allt sem er hugsað á jörðu”. Ég get ekki séð að þetta sé sönn staðhæfing hjá Einari, heldur fremur metnaðarfull áskorun um að eiga hér ríkt andlegt líf í því málumhverfi eða íverustað sem íslenskan er, í anda hugmyndar Heideggers um að tungumálið sé “híbýli verundarinnar”. Og auðvitað er ekkert mál að skrifa á íslensku hvernig nota má vélanám til að innleiða skapandi gervigreind í snjallhljóðfæri er búa yfir líkömnuðum atbeini!

Tónlist og tækni hafa alltaf farið saman. Fyrir fjörutíu þúsund árum dvöldu forfeður okkar í hellum og notuðu í það minnsta beinflautur til tónlistariðkunar. Slík hljóðfæri hafa fundist víða. Ætla má að alls kyns önnur tækni til tónlistarsköpunar, svo sem viðarbútar til ásláttar, hafi orðið til miklu fyrr, en þau verkfæri hafa fúnað og orðið að engu. Í ritaðri sögu okkar hefur frá upphafi verið mikið skrifað um hljóðfæri. Nefna má grísku goðsöguna þar sem Apollon keppti við Marsyas í hljóðfæraleik og voru fengnar í dómnefnd bæði menntagyðjurnar og fjalladísir. Tónlistarguðinn Apollon spilaði á hörpu sem stillt er út frá hlutföllum er Pýþagóras setti í röklegt kerfi nokkru síðar. Marsyas spilaði hins vegar á flautu, sem er öllu óstýrilátara hljóðfæri, sjaldan fullkomlega stillt og meira tengt andagift (gr. psyche) en rökhugsuninni (gr. logos). Eða svo segir Aristóteles sem skrifaði mikið um tónlist: um stærðfræði, sálfræði og félagsfræði tónlistar. En Marsyas tapaði í keppninni og hann var fleginn lifandi, blóð hans lak í straumum, og guðir, dísir og náttúra grétu svo úr varð stórt fljót. Þetta stutta innlit til Grikklands fyrir okkar tímatal sýnir aðeins hversu stórt hlutverk tónlist hefur í grunni menningar okkar.

Færa má rök fyrir því að tækni til tónlistariðkunar, svo sem hljóðfæri og miðlar, hafi ávallt verið á meðal þróuðustu verkfæra hvers sögulegs tímabils. Forngrikkir bjuggu til vatnsorgel, Arabar hönnuðu sjálfvirk tónlistarvélmenni, og segja má að kirkjuorgel miðalda ásamt steindum gluggum og endurómi kirkjunnar hafi verið sýndarveruleiki þess tíma. Sagan sýnir okkur röð hljóðfæra sem öll bregðast við tækni hvers tíma, svo sem sveiflýra (e. hurdy gurdy), semball, píanó, rafgítar, hljóðgervill, tölvuforrit og nútíma gervigreind í tónlist. Allt eru þetta hátækniverkfæri þar sem hönnuðir hafa notað bestu aðgengilega tækni við smíða hljómrík hljóðfæri er laga sig að líkama og limum flytjandans, en á sama tíma breyta þau hugmyndum og spilatækni tónlistarmannsins sem lagar sig að þessari tækni.

Ljóst er að þegar ný tækni kemur fram, þá er alltaf einhver tónlistarmaður einhversstaðar sem spyr sig hvernig hún getur stuðlað að framgangi tónlistarinnar. Þessa dagana eru gervitauganet (e. artificial neural networks) tækni sem vekur forvitni tónlistarmanna. Þessi tauganet gera tölvum kleift að læra í stað þess að fylgja beinum fyrirskipunum forritarans. Þessar námsfúsu vélar hjálpa okkur að greina og túlka ógnarstór gagnasöfn og veita okkur möguleikann til endurtúlkunar og endursköpunar. Út frá einu sjónarhorni tölvuvísinda má líta á tónverk sem gögn (e. data) og öll tónverk sem skrifuð hafa verið sem gagnasafn (því að hver nóta hefur númer og þær birtast á tímalínu, líkt og upplýsingar um veður eða verðbréf). Að mata tölvu útbúna vélanámi með tónlist er engin nýjung: eitt af fyrstu tónverkum sem samið var á tölvu (Illiac suite þeirra Hiller og Isaacson frá árinu 1956) notaði vélanám (nánar tiltekið Hidden Markov Models) til að semja nýja tónlist. Það sem hinsvegar er nýtt er að með djúpgervitauganetum (e. deep neural networks), hröðum örgjörvum og óendanlegu magni af aðgengilegum gögnum (sbr. milljón laga gagnabankann - http://millionsongdataset.com) þá er nú möguleikinn fyrir hendi að kenna tölvunum tónlist og fá þær til að framleiða meiri tónlist. Út um allan heim eru gerðar tilraunir með tónlist og skapandi gervigreind. Sú spurning er bæði tæknilegs eðlis (er hægt að búa til slíka tækni?) sem og fagurfræðileg (er þessi tónlist nokkurs virði?) og siðferðileg (hvaða áhrif hefur svona tækni á sköpun?). Nefna má sem dæmi forrit sem semja ókeypis lyftutónlist fyrir jútúbera, kerfi sem semja írska og sænska þjóðlagatónlist (sjá til dæmis Machine Folk Music Bob Sturms - https://themachinefolksession.org) og svo tónlistarforrit sem veita leikmönnum án mikillar tónlistarkunnáttu möguleika á að búa til tónlist sem hljómar bara ansi vel.

Skapandi gervigreind er auðvitað gífurlega skemmtilegt viðfangsefni sem vekur ýmsar spurningar um hlutverk listamannsins, eðli sköpunar og listaverksins, höfundarrétt, tækni, listheiminn og annað. Vísindamenn í hugrænum vísindum (e. cognitive science) hafa mikinn áhuga á sköpun, því sköpunin er nú álitin vera sá mannlegi eiginleiki þar sem tölvurnar geta ekki tekið framúr, ólíkt til dæmis í skák eða gó. Hér er sem gervigreindin myndi spegil á okkur og hugmyndir okkar um sjálf, greind, vitund og sköpun. Ýmis þekking innan hugrænna vísinda hefur orðið til sem afrakstur af þróun gervigreindar, vegna þess að með því að búa til tölvukerfi sem eiga að geta gert það sama og manneskjan, þá öðlumst við nýjan skilning á þeirri skepnu - og hversu óendanlega flókin hún er. Það er hér sem viðleitnin að smíða skapandi gervigreind gefur okkur nýja innsýn í hvað sköpun eiginlega er.

En verkefnið sem hér um ræðir, Intelligent instruments, fjallar ekki um vélar sem skapa tónlist að sjálfu sér, eða um höfundarrétt og algrím á samfélagsmiðlum, heldur um snjallhljóðfæri. Í þessu verkefni spyrjum við hvernig hljóðfæri - sem sjá má bæði sem framlengingu á líkamanum og sem viðmælanda (þar sem hljóðfærið bregst við á óvæntan hátt eða neitar að hegða sér eins og flytjandinn vill) - geta farið að læra á þann sem spilar á þau. Hvernig hljóðfæri geta þróast og þroskast og aðlagast hreyfingum og tónlistarlegum hugmyndum flytjandans. En við spyrjum meira: okkur langar að vita hvernig okkur líður þegar tæknin fer að taka þátt í sköpun okkar á þessa vegu. Hvernig skilgreinum við samband manns og vélar í slíkri aðstöðu? Hvernig semja tónskáld fyrir slík hljóðfæri og hvernig skilja eða upplifa áhorfendur það sem er spilað? Verkefnið mun þróa tungumál og meitla hugtök okkar um aðkomu gervigreindar í skapandi greinum.[2] Því að eitt er víst, að gervigreindin mun verða órjúfanlegur partur af tækni okkar og menningu líkt og penninn, pensillinn, ritvélin, tölvan og síminn eru.

Verkefnið fer af stað í haust - nánar tiltekið 1. september 2021 - í rannsóknarstofu okkar við Listaháskólann. Við verkefnið munu starfa, auk mín sem aðalrannsakanda, tveir nýdoktorar (Jack Armitage og Kit Braybrooke), þrír doktorsnemar, tæknimaður/hljóðfærasmiður (Halldór Úlfarsson) og verkefnisstjóri. Við munum vera í samstarfi við Háskóla Íslands varðandi doktorsnám og þar til húsa eru meðleiðbeinendur doktorsverkefna. Við munum bjóða alþjóðlegum listrannsakendum og öðru fræðafólki að vinna í rannsóknarstofunni og meistaranemar munu vinna við skilgreinda þætti verkefnisins og aðrir nemendur munu koma að því með eigin hugmyndir og verkefni. Við höfum þróað rannsóknaraðferð sem gerir okkur kleift að vinna verkefnið þverfaglega og í samstarfi við vísindafólk, bæði á Íslandi og á alþjóðlegum vettvangi. Því hvetjum við fólk að hafa samband við okkur með hugmyndir að samvinnu og koma í heimsókn í rannsóknarstofuna á föstudögum þar sem við verðum með opið hús. Verkefnið mun tengjast almenningi með þátttöku fólks í tónleikum, tilraunum, málstofum og samdrykkju (gr. symposia).

Upplýsingar um hvernig hægt er að hafa samband og taka þátt í verkefninu fást hér: thor.magnusson [at] lhi.is.
 

---------

[1] Viðtalið má horfa á hér: https://hugarflug.lhi.is/Torhallur-Magnusson

[2] Glöggir lesendur taka etv. eftir því að í þessum pistli hef ég jafnt talað um að tölvur “semja”, “framleiða” og “búa til” tónlist. Í samtali okkar Atla í Hugarflugi þá nefndi hann að tölvur framleiði tónlist, en ekki semji. Það er athyglisverð athugasemd sem ég ætla að geyma en ekki gleyma. Það er nefnilega ekki alveg á hreinu hvaða hugtök skulu notast og eins og við vitum þá verður tungumál til við notkun þess, ekki við orðabókarskilgreningar. Verkefnið sem skrifað er um hér mun taka þátt í að þróa þessa orðræðu.

ÞRÆÐIR - TÍMARIT UM TÓNLIST

Þræðir - forsíða
Þræðir - tölublað 6

Tölublað 6

Um höfunda