Íslenskan er dýr Upplýsingabyltingin sem margir telja ógnun við íslenskt mál getur orðið því stoð ef rétt er á haldið. Árni Matthíasson ræddi við Heiðar Jón Hannesson og Þorgeir Sigurðsson um möguleika Íslendinga á svið tungumálaverkfræði.

Íslenskan er dýr Upplýsingabyltingin sem margir telja ógnun við íslenskt mál getur orðið því stoð ef rétt er á haldið. Árni Matthíasson ræddi við Heiðar Jón Hannesson og Þorgeir Sigurðsson um möguleika Íslendinga á svið tungumálaverkfræði. Ú SKOÐUN er býsna algeng að íslenskt þjóðfélag eigi eftir að vera tvítyngt og menn varpa því fram eins og hverju öðru náttúrulögmáli. Þar horfa menn ekki síst til áhrifa upplýsingabyltingarinnar, sem hefur enn hert á straumi af erlendu fræðslu- og afþreyingarefni hingað til lands, og allt á ensku. Um leið líta þeir fram hjá þróun sem á sér stað í Evrópu þar sem lítil málsamfélög hafa styrkst og endurreisn á sér stað í ýmsum tungumálum sem voru á fallanda fæti eða jafnvel nánast útdauð. Þessi þróun á sér ekki síst stað með aðstoð nýjustu tækni og nefna má að kominn er vísir að sérstökum málsamfélögum á veraldarvefnum og vex óðum fiskur um hrygg.

Ofangreint er ekki síst fyrir atbeina Evrópusambandsins, sem hefur beitt sér fyrir ýmsum aðgerðum til að styrkja stöðu tungumála innan Evrópu, meðal annars með því að virkja tölvutæknina til að hagnýta málvísindi, en slík notkun hefur verið kölluð tungumálaverkfræði. Þá nýta menn tölvur sem talgervla, þýðendur, leiðréttingarvélar, ritara og svo mætti lengi telja. Fyrir vikið verður auðveldara fyrir notendur tölvutækni að leita sér upplýsinga, ekki bara á ensku, heldur einnig á frönsku, ítölsku þýsku eða hvaða Evrópumáli sem er, til að mynda með því að smella á viðeigandi hnapp á rápforriti sem snarar fyrir hann textanum á skjánum á það mál sem hann kýs eða les fyrir hann textann og þýðir um leið. Einnig má hugsa sér að sá sem leitar upplýsinga símleiðis geti fengið tölvu til að þýða fyrir sig svör þess sem rætt er við eða það sem hann vill sjálfur segja. Svo mætti lengi telja; segja má að möguleikarnir séu nánast óteljandi og sífellt bætast fleiri við eftir því sem tölvutækni fleygir fram. Til þess að þetta megi verða hefur Evrópusambandið blásið til ýmislegs samstarf á sviði tungumálaverkfræði og nú stendur sem hæst umfangsmikið verkefni sem kallast EUROMAP og er ætlað að kanna stöðu þessara mála í Evrópu; safna á einn stað öllum upplýsingum um þá sem eru að iðja við tungumálaverkfræði ýmiskonar, hvort sem þeir eru að vinna við talgervla, þýðingarforrit, textalestrarforrit, leiðréttingarforrit eða textagreiningu. Niðurstöður könnunarinnar verða svo grundvöllur frekari vinnu í upplýsingamálum innan bandalagsins, en hún á meðal annars að skila af sér tillögum sem síðan verða hluti af fimmtu rammaáætlun Evrópusambandsins.

Sautjánda tungumálið

Öll er þessi vinna áhugaverð fyrir Íslendinga, ekki síst fyrir það að tekist hefur að koma íslensku í hóp þeirra tungumála sem eru tekin með í þessari könnun og yrði þá hluti af væntanlegri tillögugerð og rammaáætlun. Þetta hefur gríðarlega þýðingu fyrir Íslendinga og íslenska menningu, því með þessu móti komast íslensk fyrirtæki inn í ýmislegt samstarf og komast yfir margvísleg verkfæri sem nýtast við að smíða íslenska þýðendur, leiðréttingarforrit og álíka. Ekki skiptir minna máli að íslenskum hugbúnaðarsmiðum, sem vilja helga sig tungumálaverkfræði, gefst kostur á að hugsa og hanna framleiðslu sína fyrir Evrópumarkað en ekki bara fyrir Ísland; íslenskur margmiðlunardiskur yrði um leið alþjóðlegur, því á honum mætti með góðu móti og á ódýran hátt koma fyrir upplýsingum á mörgum tungumálum, svo dæmi sé tekið, en einnig myndu erlend fyrirtæki sjá sér fært að framleiða slíkt efni fyrir íslenskan markað samtímis stærrri markaðssvæðum, því þó ekki sé hann stór má hagnast á honum ef herkostnaðurinn er ekki of mikill.

Lykilmaður í að lauma íslensku inn sem sautjánda tungumáli í þessari áætlun Evrópusambandsins er Heiðar Jón Hannesson, starfsmaður SKÝRR, sem hefur meðal annars unnið að samevrópsku verkefni sem kallast MODE, eða Music on Demand. Hann fékk í lið með sér Þorgeir Sigurðsson, rafmagnsverkog íslenskufræðing, sem kalla má tungumálaverkfræðing, en hann smíðaði meðal annars talgervilinn Óðin, sem byggist á bragfræði dróttkvæða og er því vel að sér í samþættingu tölvutækni og málvísinda.

Heiðar Jón segir að Evrópusambandið hafi haft áhuga fyrir því að Ísland yrði með í EUROMAP verkefninu, en enginn hafi sýnt því áhuga hérlendis. "Ég fékk upplýsingar um EUROMAP frá Rögnvaldi Ólafssyni í Brussel og fannst ótækt að við myndum missa af því. Aðstandendur verkefnisins hjá Evrópusambandinu þekktu til SKÝRR og samþykktu því þátttöku Íslendinga, en þess má geta að færa þurfti til fjármuni vegna þessa, því ekki var gerð ráð fyrir að við yrðum með."

Þeir Heiðar Jón og Þorgeir segja að Ísland hafi ekki síst komist í EUROMAP vegna þess að innri gerð íslensks upplýsingaþjóðfélags sé lenga komin en flestra Evrópulanda. Hér á landi hafi menn verið fljótir að tileinka sér tölvutækni og Ísland keppi við Finnland um að vera tölvuog netvæddasta land Evrópu.

Þeir segja að ekki sé síst hagkvæmt fyrir Íslendinga að taka fullan þátt í þessu samstarfi Evrópulanda, sé litið til þess hvaða fjármunir sparast til lengri tíma litið. Það er dýrt að tala íslensku og sjálfsagt megi reikna það út upp á krónur og aura hve hagkvæmara væri að taka upp ensku sem opinbert mál, en kostnaðinn við að nota íslensku mætti minnka og um leið auka til muna framboð á upplýsingum og efni á íslensku með tölvutækni. Þannig er algengt að kennslubækur til að mynda í menntaskólum séu á erlendum málum vegna þess að ekki er talið svara kostnaði að snara þeim á íslensku. Þetta mætti auðvelda með því að hanna nýtileg þýðingarforrit sem gæti líklega seint skilað fullkomnum texta en flýtt verulega fyrir þýðingarvinnu og auðveldað með því að vinna hráþýðinguna. Annað dæmi sem þeir nefna er að tölvur gætu "hlustað" á ræðumenn, til að mynda alþingismenn, og skráð textann jafnóðum, sem sparar gríðarlega vinnu og fé.

Þeir Heiðar Jón og Þorgeir segja að nokkuð sé í land að til sé nothæft þýðingarforrit fyrir íslensku og ekki eftir neinu að bíða. "Það hefur viljað brenna við að menn vilja bíða og sjá hvað setur," segja Heiðar Jón. "Upplýsingabyltingin fer ekki fram hjá neinum en það hefur verið eins og menn hafa viljað hinkra við og sjá hvort hún gangi ekki yfir, hvort þetta "vandamál" hverfi ekki með tímanum. Það er ástæða fyrir okkur að taka af skarið og ákveða hvert við viljum stefna; hvort við ætlum að taka þátt í upplýsingaþjóðfélaginu á okkar eigin forsendum og á okkar tungumáli," segir hann og bætir við að innan menntamálaráðuneytisins hafi menn tekið við sér, en fleiri þurfi að koma að. "Við tókum álíka ákvörðun þegar við ákváðum að skrifa fræðirit okkar á íslensku en ekki á latínu og að prenta biblíuna á íslensku en ekki flytja hana inn á dönsku."

Þorgeir nefnir sem dæmi um hagnýtt gildi samevrópskrar hugsunar að helstu tvær alnetsleitarvélar í Evrópu, þ.e. tölvuforrit sem hjálpa við að leita að upplýsingum á veraldarvefnum, séu í Svíþjóð og báðar bjóði þær upp á íslenskt viðmót. "Þeir sem sjá þetta í fyrsta sinn geta ekki annað en undrast að einhver skuli hafa lagt á sig þessa vinnu, að þýða síðurnar og setja upp fyrir Íslendinga, en í öðru tilvikinu var sænska símafyrirtækið Telia að setja upp viðkomandi leitarvél og þótti sjálfsagt að hafa viðmót á íslensku, því Ísland er hluti af Norðurlöndunum og því Evrópu. Það er þó ekki sjálfgefið að öllum finnist það, og nægir að nefna að í raun eru engin rök fyrir því að íslenska sé með í upplýsingasamstarfi Evrópuþjóða, þar sem nærri 50 tungumál eru töluð innan Evrópska efnahagssvæðisins.

Það hjálpar okkur Íslendingum hve við erum tæknivæddir og hve innri gerð upplýsingaþjóðfélagsins er þróuð á Íslandi, eins og áður er getið, en við verðum að taka ákvörðun um að vera með og greiða ákveðið rúllugjald, ef svo má segja."

Heiðar Jón segir að fleira sé í bígerð á sviði upplýsingatækni á Evrópska efnahagssvæðinu, því þrítugasta janúar verður kynnt í París ný áætlun um margtyngt upplýsingaþjóðfélag, svokölluð MLIS-áætlun, sem tengist EUROMAP verkefninu og miðar að því að ýta undir notkun tungutækni í Evrópu. Íslendingar hafa ákveðið að taka þátt og sitja þar með við sama borð og þjóðir Evrópusambandsins og íslensk fyrirtæki og einstaklingar geta sótt um styrki vegna verkefna sem þeir eru með á prjónunum og tengjast tungumálaverkfræði, en styrkir verða fáir og vel valdir að hans sögn.

Gagnagrunnar um íslenskt mál

Meðal þess sem Íslendingar þurfa að leysa er að búa til gagnagrunna um íslenskt mál sem hver sem vill getur keypt aðgang að til þess að nota til að mynda í hugbúnað eins og leiðréttingarforrit eða talgervil sem les fyrir menn tölvupóst og er stöðugt uppfærður, því málið er sífellt að breytast. Slík vinna, hvort sem hún er unnin af opinberum aðilum eins og Orðabók Háskólans eða einkaaðilum, styrkir stöðu íslenskunnar sem lifandi máls, en hún er skammt á veg komin, mun skemmra en í öðrum Evrópulöndum. "Það má líkja þessu við vegakerfið," segir Heiðar Jón. "Þjóðin á vegina og heldur þeim við en síðan keppa einstaklingar við að nýta vegina á sem hagkvæmastan hátt. Ef tungumál á að halda velli verður slík innri gerð að vera til staðar í þjóðfélaginu sem notar það og slík grunngerð er ekki bara til fyrir innfædda; hvaða fyrirtæki sem er, innlent og erlent, verður að geta notfært sér vegakerfið til að tryggja þróun og framgang. Það má grípa til líkinga eins og Skeiðarárhlaups; við verðum að taka ákvörðun um hversu góð verkfæri við viljum, hvort það eiga að vera vegaslóðar sem skröltast má á eða hvort við viljum fullkomin og nútímaleg verkfæri til að tryggja að íslensku skoli ekki út í hafsauga fyrir flóði upplýsinga á ensku."

Eins og fram hefur komið eru þeir Heiðar Jón og Þorgeir starfsmenn SKÝRR og segjast hafa fengið góða aðstöðu til starfa sinna hjá SKÝRR. Þeir leggja þó áherslu á að ekki sé sjálfgefið að SKÝRR styrki vinnu sem þessa, því ekki hafi fyrirtækið beinan hag af því að taka þátt fyrir utan gagnagrunnvinnu í EUROMAP. "Það kostar sitt að vera með," segja þeir, "og til lengri tíma litið er verið að tala um gríðarlega fjárfestingu, jafnvel fjárfestingu upp á milljarða á næstu árum eða áratugum. Víst er það mikið fé, en það kostar að tala íslensku og niðurstaðan úr þeirri fjárfestingu gæti tryggt stöðu íslenskunnar til frambúðar. Líklega horfa menn í peninginn vegna íslenskunnar, vegna þess að menn hafa hingað til talið að hún kostaði ekkert, og vissulega er ekki sjálfgefið að við notum íslensku í upplýsingasamfélagi framtíðarinnar."

Morgunblaðið/Ásdís

Heiðar Jón Hannesson og Þorgeir Sigurðsson.

"Upplýsingabyltingin fer ekki fram hjá."

"Það kostar sitt að vera með,"