Fara í efni
Pistlar

Gervigreind: Ekki lengur vísindaskáldskapur

GERVIGREIND - 1

Gervigreind og almenningur

Undanfarnar vikur og mánuði hefur umræðan um gervigreind orðið sífellt háværari. Ýmsar skoðanir hafa komið fram, sumir telja að gervigreind sé lausn við öllum fyrirsjáanlegum áskorunum mannkyns, á meðan aðrir vara við mögulegum hættum sem fylgja þróuninni. Til að við getum átt gagnlega umræðu um áhrif gervigreindar er gott að byrja á að skilgreina hvað „gervigreind“ eða Artificial Intelligence (AI) þýðir. Við getum stutt okkur við nokkuð einfalda skýringu: „Allt sem tölva gerir sem líkir eftir mannlegri greind eða getu er hægt að flokka sem gervigreind.“

Saga og þróun gervigreindar

Til að skilja betur hvernig við komumst á þann stað sem við erum í dag er gagnlegt að skoða söguna og þróunina á bak við gervigreind.

Byrjun og þróun

Gervigreind hefur verið í þróun frá sjötta áratugnum. Vísindamenn og sérfræðingar á sviði tölvunarfræði hafa á þeim tíma þróað fjölbreytta tækni sem gerir tölvum kleift að framkvæma verkefni sem áður var aðeins á færi manna og kostaði oft mikinn tíma og handavinnu. Fyrir áhugasama mæli ég eindregið með að lesa grein sem birtist í Tímanum árið 1982 en þar fjallar Dr. Jörgen Pind sálfræðingur um gervigreind og vélvit, og má segja að greinin sé stórmerkileg sé hún skoðuð í ljósi þeirrar þróunar sem orðin hefur undanfarin ár.

https://timarit.is/page/4018035?iabr=on

Spunagreind, generative AI

Spunagreind er tegund gervigreindar sem notar risastór gagnasöfn og flókin reiknirit til að framleiða nýtt efni, eins og texta, myndir eða jafnvel tónlist og myndbönd. Þetta gerir spunagreind einstaklega áhugaverða og öfluga tækni en um leið veldur hún einnig ýmsum áskorunum og áhyggjum.

Dæmi og áhrif

Þó að spjallmenni séu ekki alveg ný af nálinni og fyrsta slíka forritið, ELIZA frá 7. áratugnum, er sú spunagreind sem við erum að fjalla um, kom fyrst fyrir almenningssjónir með Chat GPT-3 í nóvember 2020. GPT-3, sem stendur fyrir Generative Pre-trained Transformer 3, var stærsta og öflugasta málalíkanið sem hafði verið þróað fram að þeim tíma. Hins vegar hefur þróunin verið svo ör að nýjustu módelin, eins og GPT-4o, gera GPT-3 næstum úrelt í samanburði. GPT-4o býður upp á mun meiri getu, þar á meðal fjölhæfni (multimodality) og stærri samhengisglugga. Ég nota enn GPT-3.5 til ýmissa verka en nýju módelin stækka, verða hraðari og fullkomnari, sem gerir þá tækni öflugri og betri fyrir ýmis notkunartilfelli.

Gagnasöfnin á bak við spunagreind

Spunagreind byggir á afar flókinni virkni risagagnagrunna. Hugsum okkur þessa gagnagrunna eins og risavaxin bókasöfn sem innihalda milljarða texta og mynda. Líkanið „les“ og „lærir“ af öllum þessum bókum. Því fleiri bækur sem bókasafnið hefur að bjóða, því betri verður niðurstaðan. Virknin er þó ekki að fullu þekkt og erfitt að spá fyrir um hvernig líkanið mun bregðast við tilteknum skilaboðum eða fyrirmælum. Þetta gerir spunagreind bæði spennandi og varasama.

Áskoranir gervigreindar

Áskoranirnar sem fylgja þróun og notkun gervigreindar eru margar. Samfélagslegar og siðferðislegar spurningar vakna, sérstaklega þegar kemur að notkun persónuupplýsinga og miðstýringu upplýsinga. Mikilvægi góðra upplýsinga og gagnrýnnar uppbyggilegrar umræðu er mikið. Þegar stórfyrirtæki eins og OpenAI, Google, Microsoft og Facebook hafa mikla yfirburði til að þjálfa og þróa þessi módel veldur það áhyggjum af miðstýringu upplýsinga. Við verðum því að vera meðvituð um að stjórnendur stórfyrirtækja hafi mikil áhrif á það hvaða og hvernig upplýsingum er miðlað með þeirra módelum.

Siðferðislegar og lagalegar áskoranir

Eins og bent er á í viðtalinu við Dr. Jörgen Pind, þegar tölvuforrit verða svo flókin að enginn getur skilið þau, er áleitin spurning um hver beri ábyrgð á niðurstöðum gervigreindarinnar. Þetta er ekki bara tæknilegt vandamál, heldur einnig siðferðilegt og lagalegt. Þegar við notum gervigreind til að taka ákvarðanir sem geta haft mikil áhrif á líf fólks, er nauðsynlegt að tryggja að við höfum fullan skilning á því hvernig og hvers vegna þessi ákvörðun var tekin. Einnig skapar þetta miklar áskoranir í menntakerfinu, vísindum og rannsóknum sem betur verður komið að í komandi pistlum.

Spunagreind í notkun

Spunagreind hefur verið notuð í fjölmörgum tilvikum þar sem hún hefur skilað allt frá góðum árangri, til fullkomins skáldskapar sem m.a. hefur komið lögmönnum í Bandaríkjunum í klandur, ég get nánast slegið því föstu að spunagreindin sé besti lygalaupur sem mannkynið hefur tekist á við. Tæknin nýtist til að skrifa greinar og fréttir, og til að búa til listaverk, sem einnig verður viðfangsefni í sérstökum pistli. Talsverð umræða hefur verið um listsköpun með gervigreind og mörg álitamál sem þarf að kryfja. Spunagreindin hefur opnað dyrnar að nýjum möguleikum í námi, rannsóknum, fjölmiðlum, menningu og listum en um leið hafa vaknað spurningar um höfundarrétt, siðferði og gæði framleiðslunnar.

Gervigreind og samfélagið

Þegar við skoðum spunagreind nánar verður ljóst að hún getur orðið verðmætt verkfæri og tæknin nýtileg til margra verka. Hins vegar er ljóst að innleiðingu á tækninni mun fylgja ójafnvægi og afleiðingar á vinnumarkaði eflaust neikvæðar gagnvart ákveðnum störfum. Þó er mikilvægt að leiða hugann að því að þetta er langt frá því fyrsta tæknin sem kemur fram á sjónarsviðið og veldur víðtækum samfélagsbreytingum. Það sem er kannski einstakt við þennan tíma í mannkynssögunni er að almenn notkun á tölvum og tölvur á heimilum ruddi sér ekki til rúms fyrr en upp úr 1990. Eflaust má ætla að sú samfélagsmynd sem var fyrir komu einkatölvunnar sé ansi ólík þeirri sem við búum við í dag.

Erum við stödd í einhvers konar stafrænu villtu vestri?

Sú öra þróun í margvíslegri tækni um allan heim er nær stjórnlaus og álitamál hvort þetta sé allt af hinu góða. Ég tel að mikilvægt sé að staldra við og velta þessu fyrir sér. Við erum í villta vestrinu, þetta er allt nýtt, tölvan er glæný og samfélagið enn að reyna ná jafnvægi eftir innleiðingu hennar. Hraði tækniþróunar og samfélagsins verður einhvern veginn að haldast í hendur og við verðum að reyna koma í veg fyrir að afkomendur okkar beri skertan hlut vegna stjórnleysis okkar í teknópartíinu. Undarlegir auðkýfingar jafnvel búnir að fylla sporbauga um jörðu af drasli og ákvarðanataka í höndum gervigreindar sem enginn í raun skilur. Þetta eru áleitnar spurningar sem ég tel að sé brýnt að séu skeggræddar á kaffistofum og við eldhúsborð af almenningi, því almenningur er samfélagið og almenningur á að ráða!

Ábyrg notkun

Að mínu mati er tilkoma spunagreindarinnar ekki bylting, heldur stökk í þróun á tölvutækni sem ekki sér fyrir endann á að færi okkur sífellt fleiri nýjungar. Það er mikilvægt að við sem samfélag höldum uppi góðri og gagnrýnni umræðu um gervigreind til að tryggja að við notum þessa tækni á ábyrgan hátt og til hagsbóta fyrir alla. Við þurfum að vera meðvituð um áhættuna en einnig nýta tækifærin sem þessi tækni býður upp á. Í næsta pistli ætla ég að fjalla meira um notkun á spunagreind, fara yfir aðferðir við að setja henni fyrirmæli og fiska eftir þeirri útkomu sem við erum að leita eftir, kallað prompt engineering á ensku.

Helstu hugtök í greininni og stuttar skýringar

  1. Gervigreind (Artificial Intelligence - AI):
    • Tækni sem gerir tölvum kleift að líkja eftir mannlegri greind og getu.
  2. Spunagreind (Generative AI):
    • Tegund gervigreindar sem notar stór gagnasöfn og flókin reiknirit til að framleiða nýtt efni, eins og texta, myndir eða tónlist.
  3. Módel
    • Spunagreind byggir á ólíkum módelum sem hafa samt svipaða virkni. Mikill fjöldi er til en helst má nefna ChatGPT (OpenAI), Llama (Meta, Facebook), Gemini (Google) og Copilot (Microsoft).
  4. GPT-3:
    • Generative Pre-trained Transformer 3, tungumálalíkan þróað af OpenAI, sem kom út í nóvember 2020 og gat framleitt texta sem líkir eftir mannlegum skrifum.
  5. GPT-4o (omni):
    • Nýjasta útgáfan af tungumálalíkani OpenAI, með meiri getu, fjölhæfni (multimodality) og stærri samhengisglugga en GPT-3.
  6. Fjölhæfni (Multimodality):
    • Geta til að vinna með fleiri en eina tegund gagna á sama tíma, eins og texta, myndir, vídeó, hljóð, jafnvel í rauntíma.
  7. Samhengisgluggi (Context window):
    • Gluggi þar sem notandi leggur inn fyrirmæli.
    • Stærð byggir á getur módelsins við úrvinnslu gagna, mælt í fjölda tókena (orða eða stafa).
  8. Gagnasöfn (database):
    • Risavaxin „bókasöfn“ stafræns efnis sem módel lærir af til að bæta getu sína.
  9. Fyrirmæli (Prompt):
    • Textafyrirmæli sem notuð eru til að leiðbeina spunagreindinni um hvaða útkomu eða niðurstöðu á að framleiða.
  10. Fyrirmælahönnun (Prompt engineering):
    • Aðferðir við að setja spunagreindinni fyrirmæli til að ná fram tiltekinni útkomu.

Ef þið hafið fleiri ábendingar, athugasemdir eða spurningar, má endilega hafa samband á netfangið magnus.smarason@gmail.com.

Magnús Smári Smárason er lágkóða gagnagrúskari

Lifandi steingervingur: Fornrauðviður

Sigurður Arnarson skrifar
03. júlí 2024 | kl. 10:10

Að temja tæknina II: Í klóm drekans

Magnús Smári Smárason skrifar
02. júlí 2024 | kl. 10:50

Sykur

Sigmundur Ernir Rúnarsson skrifar
01. júlí 2024 | kl. 11:30

Dómgreind

Ólafur Þór Ævarsson skrifar
01. júlí 2024 | kl. 06:00

Seigla og linka

Ólafur Þór Ævarsson skrifar
30. júní 2024 | kl. 06:00

Þú trylltist og varst rekinn út af!

Orri Páll Ormarsson skrifar
28. júní 2024 | kl. 11:00