Tæknikapphlaup tungunnar

Gervigreind | 14. mars 2023

Tæknikapphlaup tungunnar

„Þetta samstarf við OpenAI er til komið vegna ferðar sendinefndar forseta Íslands sem Almannarómur skipulagði,“ segir Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri máltæknimiðstöðvarinnar Almannaróms, í samtali við mbl.is, en úr véum fyrirtækisins berast nú þau tíðindi að íslenska hafi verið valin fyrst tungumála, að ensku frátalinni, í þróunarfasa nýjustu útgáfu gervigreindar-mállíkansins GPT-4 en á því byggist samtalsgreindin ChatGPT. Og sjaldan lýgur Almannarómur sem alkunna er.

Tæknikapphlaup tungunnar

Gervigreind | 14. mars 2023

Lilja Dögg Alfreðsdóttir, menningar- og viðskiptaráðherra, á fundinum með Sam …
Lilja Dögg Alfreðsdóttir, menningar- og viðskiptaráðherra, á fundinum með Sam Altman, stofnanda og framkvæmdastjóra Open AI, í maí í fyrra. Ljósmynd/Menningar- og viðskiptaráðuneytið

„Þetta samstarf við OpenAI er til komið vegna ferðar sendinefndar forseta Íslands sem Almannarómur skipulagði,“ segir Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri máltæknimiðstöðvarinnar Almannaróms, í samtali við mbl.is, en úr véum fyrirtækisins berast nú þau tíðindi að íslenska hafi verið valin fyrst tungumála, að ensku frátalinni, í þróunarfasa nýjustu útgáfu gervigreindar-mállíkansins GPT-4 en á því byggist samtalsgreindin ChatGPT. Og sjaldan lýgur Almannarómur sem alkunna er.

„Þetta samstarf við OpenAI er til komið vegna ferðar sendinefndar forseta Íslands sem Almannarómur skipulagði,“ segir Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri máltæknimiðstöðvarinnar Almannaróms, í samtali við mbl.is, en úr véum fyrirtækisins berast nú þau tíðindi að íslenska hafi verið valin fyrst tungumála, að ensku frátalinni, í þróunarfasa nýjustu útgáfu gervigreindar-mállíkansins GPT-4 en á því byggist samtalsgreindin ChatGPT. Og sjaldan lýgur Almannarómur sem alkunna er.

Sendiförin sem Jóhanna segir af var farin vestur um haf í fyrravor og starfsstöðvar OpenAI þá meðal annars heimsóttar. „Markmiðið var að koma íslenskum máltæknilausnum inn í tækin og tæknina sem fólk notar dags daglega,“ heldur hún áfram.

Undanfarin fjögur ár hafi 60 sérfræðingar á vegum Almannaróms unnið að því að smíða téðar máltæknilausnir eða innviði, „en það þýðir ekkert að smíða þetta ef það er ekki notað, það þarf að koma því yfir í lausnir fyrir neytendur. Út frá sjónarhóli Almannaróms hefur það verið mjög stór hluti af verkefninu að koma þessum lausnum í notkun,“ útskýrir framkvæmdastjórinn.

Aðra hverja viku deyr tungumál

Hafi fjögurra ára áætlun Almannaróms, sem nú er að renna skeið sitt á enda, gert ráð fyrir að þegar máltækniafurð lægi fyrir yrði haldið til Bandaríkjanna í för sem forsetinn leiddi og kæmi fulltrúum Almannaróms í samband við það fyrirtæki sem nýttist því starfi sem unnið hefði verið á Íslandi.

Frá fundinum með forsvarsmönnum OpenAI þar sem íslenska var valin …
Frá fundinum með forsvarsmönnum OpenAI þar sem íslenska var valin í þróunarfasa fyrirtækisins með gervigreind á sviði mállíkana. Ljósmynd/Menningar- og viðskiptaráðuneytið

„Við fórum þangað til að tala máli íslenskunnar, að hún yrði hluti af lausnum þessara fyrirtækja, og ekki síður máli annarra smærri tungumála. Við töluðum mikið fyrir því að íslenska gæti orðið sporgöngutungumál og rutt veginn fyrir önnur tungumál. Það var svona það sem við seldum, innan gæsalappa, OpenAI, að vinna með okkur að því að búa til þetta módel að því hvernig væri hægt að vinna og þau gætu þá tekið upp og unnið, út frá okkar samstarfi, með öðrum þjóðum til að vernda tungumálið,“ segir Jóhanna frá.

Hún bendir á að tungumál heimsins séu um 7.000 um þessar mundir og aðra hverja viku deyi eitt þeirra út. Ástæðan fyrir öllu þessu máltæknistússi Almannaróms væri að tryggja framtíð íslenskrar tungu.

„Það að íslenska sé eina tungumálið utan ensku sem er fínþjálfað á GPT-4-mállíkaninu er til komið vegna þessarar ferðar og fundarins sem við áttum með Sam Altman, stofnanda og framkvæmdastjóra OpenAI, og öðrum sem starfa þar. Út frá þessu sambandi okkar vex þetta samstarf,“ segir Jóhanna.

Næsta máltækniáætlun stendur fyrir dyrum

Hver skyldu þá vera næstu skref í þessu rammíslenska verkefni sem teygir anga sína alla leið til Bandaríkjanna?

„Næstu skref eru að halda þessu samstarfi áfram og það er kannski ágætt að taka það fram að þróun mállíkans er aldrei lokið, OpenAI mun gefa út fleiri og uppfærð mállíkön sem munu geta gert enn þá meira, þetta er öflugasta gervigreindarlíkan sem hefur verið gefið út og næstu skref eru að sjá til þess að íslenskan haldi í við tæknina,“ segir Jóhanna af metnaðarmálum Almannaróms.

Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, segir næstu skref vera að …
Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, segir næstu skref vera að tryggja að íslenskan haldi í við tæknina í hinum stóra heimi tungumálanna. Ljósmynd/Aðsend

Áfram verði hlutverk stjórnvalda að búa til og fjármagna næstu máltækniáætlun þar sem sú síðasta sé nú að endimörkum komin sem fyrr segir en verðugan lokapunkt hennar segir Jóhanna samkomulagið við OpenAI.

„Rannsóknar- og þróunarhópurinn SÍM [Samstarf um íslenska máltækni] hefur undanfarin fjögur ár þróað þá innviði máltækni sem þessi árangur byggir á. Það er ástæða til að þakka þeim sérstaklega fyrir þeirra framlag,“ leggur framkvæmdastjórinn áherslu á.

„Stjórnvöld hafa stutt mjög myndarlega og af miklum áhuga við þetta verkefni og við vonum að svo verði áfram. Við erum orðin fyrirmynd annarra og stærri tungumála og það er ákveðinn ábyrgðarhluti að tala þeirra máli,“ segir Jóhanna Vigdís Guðmundsdóttir að lokum en þess má geta að á mánudaginn kemur, 20. mars, klukkan 13 verður haldinn kynningarfundur í Grósku í Vatnsmýri undir yfirskriftinni „Framtíðin svarar á íslensku“ þar sem árangur máltækniáætlunar verður kynntur, fjallað um næstu skref stafrænnar vegagerðar með máltækni og samstarfið við OpenAI kynnt nánar en fulltrúar fyrirtækisins sækja fundinn.

Eitt margra dæma um nýtingarmöguleika gervigreindarinnar á sviði máltækni þar …
Eitt margra dæma um nýtingarmöguleika gervigreindarinnar á sviði máltækni þar sem íslenskunni er tryggður verðugur sess. Skjáskot/Aðsent
mbl.is