Fleiri sjaldgæf orð í íslensku þýðingunni

mbl.is/Hari

Niðurstöður benda til að hlutfall algengustu orða sé lægra í textum íslensku þýðingarinnar í lesskilnings- og náttúruvísindahluta PISA-prófanna 2018 en í ensku frumtextunum og að hlutfall orða í flokki sjaldgæfustu orðanna sé umtalsvert hærra í íslensku textunum en þeim ensku. Þá virðist dreifing orða á milli orðtíðniflokka vera jafnari í ensku en íslensku þýðingunni.

Þetta kemur fram í greininni Greining á orðanotkun í lesskilnings- og náttúruvísindahlutum PISA 2018: Samanburður á íslensku þýðingunni og enska textanum eftir þær Auði Pálsdóttur, lektor við menntavísindasvið Háskóla Íslands og Sigríði Ólafsdóttur lektor. 

Segja þær að fram hafi komið vísbendingar um ákveðið ósamræmi og ójafnvægi sem fólst í að tveir þriðju hlutar þeirra íslensku orða, sem féllu í annan tíðniflokk en ensku orðin, voru sjaldgæfari en samsvarandi ensk orð.

„Í ljós kom að fækka hefði mátt orðum í ólíkum orðtíðniflokkum með því að nota íslenskt samheiti í sama orðtíðniflokki og enska orðið og að draga hefði mátt enn frekar úr ósamræminu með því að velja samheiti úr nærliggjandi tíðniflokki. Hlutfall íslenskra samheita sem voru algengari og lengri var yfir 30% í textunum fjórum. Niðurstöðurnar gefa tilefni til að endurskoða þurfi leiðbeiningar OECD og beina því til þýðenda að þeir taki mið af orðtíðnilistum við val á orðum,“ segir í greininni.

Markmið þessarar rannsóknar var að kanna samræmi í orðtíðni í íslenskum og enskum textum á lesskilnings- og náttúruvísindahluta PISA-prófanna 2018. Ef þýðing texta í alþjóðlegu prófi er þyngri eða léttari en sami texti á upprunalega málinu getur það haft áhrif á skilning og skekkt samanburð milli tungumála.

Greindir voru tveir textar úr lesskilningshluta PISA 2018 og tveir úr náttúruvísindahlutanum. Notaður var orðtíðnilisti íslenskrar risamálheildar og enskur orðtíðnilisti sem byggist á tveimur málheildum og er aðgengilegur í gegnum hugbúnaðinn VocabProfile. Orðin voru flokkuð eftir tíðni í fimm flokka. Ef munur var á tíðniflokki orða á íslensku og ensku var kannað hvort til væri samheiti fyrir íslenska orðið í sama tíðniflokki og það enska og lengd samheita borin saman. 

Íslenskir nemendur hafa staðið sig einna verst í alþjóðlegum samanburði hvað varðar frammistöðu í lesskilningi og læsi á náttúruvísindi eftir að grunnskóla lýkur samkvæmt niðurstöðum PISA árið 2015, en þróunin hefur verið neikvæð frá árinu 2000.

„Þar sem hlutfall algengari og lengri samheita var meira en þriðjungur orða, sem féllu í ólíkan tíðniflokk en á ensku í textunum fjórum, má ætla að almenn viðmið OECD (2016) um að lengri orð hafi tilhneigingu til að vera sjaldgæfari sé hugsanlega misvísandi fyrir íslenska þýðendur. Þess ber að geta að löng orð í íslensku eru gagnsærri en ensk orð og það skiptir væntanlega máli í þessu sambandi.

Langt íslenskt orð getur verið auðskiljanlegt þótt lesandi hafi aldrei séð það áður, en slíkt er ólíklegt með enskt orð. Aftur á móti benda niðurstöðurnar til að mikilvægt sé að þýðendur noti orðtíðnilista sem byggja á málheildum til að gæta samræmis í orðavali við upphaflegu útgáfuna.

Rannsóknin hefur takmarkanir líkt og aðrar. Hér var unnið með fjóra texta sem eru aðeins hluti þeirra viðfangsefna sem 15 ára nemendur tókust á við árið 2018 og ekki fengu allir þátttakendur sömu textana. Þá þarf líka að hafa í huga að ekki er nógu mikið vitað um sambandið á milli tíðni íslenskra orða í risamálheildinni og orðaforða Íslendinga á misjöfnum aldri. Spyrja þarf hvort orðaforði aukist samhliða orðtíðni með hækkandi aldri og hvað megi gera ráð fyrir að hátt hlutfall 15 ára unglinga þekki orð í hverjum tíðniflokki.

Orðtíðnilistar hafa þó þær takmarkanir að þar er ekki tekið tillit til margræðni orða. Aðeins er orðflokkur gefinn (t.d. nafnorð, sagnorð, forsetning) en ekki er greint á milli mismunandi merkingar sem sama orð í sama orðflokki getur haft. Dæmi um slíkt er orðið skeið sem kynnt er í niðurstöðum. Í kvenkyni merkir orðið mataráhald en í hvorugkyni tímabil (sem á við í samhengi textans). Þá þarf að hafa í huga að orðtíðnilistarnir sem unnið var með byggja á málheildum sem eru ekki að öllu leyti sambærilegar. Þótt niðurstöður þessarar rannsóknar gefi vísbendingar um að endurskoða þurfi leiðbeiningar fyrir þýðendur alþjóðlegra prófa kalla þær einnig á að unninn verði íslenskur hugbúnaður á borð við VocabProfile.

Slíkt verkfæri, sem lægi aðgengilegt á vef, fæli ekki aðeins í sér mikinn tímasparnað í vinnu þýðenda við að rýna í fjölbreytni orða út frá orðtíðnilistum. Slíkt verkfæri myndi líka gefa kennurum tækifæri til að fylgjast með framförum nemenda sinna og að finna orð sem gætu reynst nemendum þeirra erfið, en einnig nemendum sjálfum og íslenskum almenningi sem rýna vill í eigin skrif. Í rannsóknum er grundvallaratriði að þær mæli það sem þeim er ætlað að mæla, þ.e. að gæta þarf að réttmæti rannsókna svo hægt sé að draga trúverðugar ályktanir af niðurstöðum þeirra. Ef til vill er ástæða til að benda á að ef Íslendingar spara sér að þýða úr frönsku verður að gera einhverjar aðrar ráðstafanir til að tryggja réttmæti þýðingarinnar, segir meðal annars í grein þeirra en hana má lesa í heild hér.

mbl.is