Í mínum huga er tungumál hverrar þjóðar hennar helsta gersemi, þar sem öll mannleg samskipti byggjast á því. Tungumálið hafði mikilvægt hlutverk í sjálfstæðisbaráttu íslensku þjóðarinnar á sínum tíma. Segja má að það hafi verið vopn Íslendinga. Í raun var það helsta röksemd leiðtoga þjóðarinnar þegar þeir kröfðust sérstöðu innan danska konungsríkisins. Vegna þeirra öru samfélags- og tæknibreytinga sem orðið hafa síðustu árin, er nauðsynlegt að huga vel að framþróun tungumálsins. Tæknin hefur þurrkað út fjölda landamæra. Við komumst nú í fjölbreyttari og nánari snertingu við aðra menningu og menningarheima en eins og Eiríkur Rögnvaldsson, prófessor emerítus, skrifar: „… er ein stærsta áskorunin sem við stöndum nú frammi fyrir á sviði íslenskrar menningar … að tryggja að leiðir milli íslensks menningarheims og annarra menningarheima haldist greiðar – í báðar áttir – án þess að það verði á kostnað íslenskunnar.“
Framar vonum
Á dögunum tók ég þátt í fundaröð sendinefndar forseta Íslands með tæknifyrirtækjum í Bandaríkjunum, þar á meðal Apple, Meta, Amazon, Open AI og Microsoft. Markmið fundanna var að sýna forsvarsfólki fyrirtækjanna fram á mikilvægi þess að íslensk tunga eigi sinn sess í þróun á nýjustu tæknilausnum og að kynna þær afurðir sem þegar eru til staðar fyrir tilstilli máltækniáætlunar íslenskra stjórnvalda. Alls staðar var málstað íslenskunnar tekið vel og frekara samstarf rætt. Raunar fóru viðtökurnar fram úr mínum björtustu vonum.
Markmið máltækni
Máltækni snýst um að þróa kerfi sem geta unnið með og skilið tungumál og stuðlað að notkun þeirra í samskiptum manns, tölvu og annarra tækja sem byggjast á stafrænni tækni.
Markmið máltækniáætlunar stjórnvalda (2018-2022) er að tryggja að hægt verði að nota íslensku í samskiptum við tæki og í allri upplýsingavinnslu. Forgangsverkefni áætlunarinnar eru þau verkefni sem mynda nauðsynlegan grunn fyrir áframhaldandi þróun á mismunandi sviðum máltækni fyrir íslensku. Gerður var samningur við sjálfseignarstofnunina Almannaróm um rekstur miðstöðvar máltækniáætlunar. Almannarómur hefur gengið frá samstarfssamningum við hóp rannsakenda með sérþekkingu á sviði málvísinda og máltækni og ber sá hópur nafnið Samstarf um íslenska máltækni (SÍM).
Með samstarfssamningum er rannsakendunum falið að annast framkvæmd þeirra verkefna sem eru tilgreind í máltækniáætluninni.
Frá Emblu til yfirlestrar
Verkefni máltækniáætlunar eru flokkuð í talgreiningu, talgervingu, vélþýðingar, málrýni og málföng. Með smíði þeirra og innleiðingu verður fólki og fyrirtækjum auðveldað daglegt líf með ýmsu móti í samskiptum hér innanlands sem og í samskiptum við útlönd. Yfir 60 sérfræðingar hafa unnið af miklum metnaði undanfarin ár að eftirtöldum lausnum sem eru hjartað og sálin í máltækniverkefni stjórnvalda. Þessar lausnir nýtast öllum sem vilja smíða hugbúnaðarlausnir sem innihalda hágæðaíslensku fyrir almenning og fyrirtæki. Áhersla er lögð á aðgengi að þessum lausnum svo að þær nýtist öllum.
Talgreinir: Hugbúnaður sem breytir töluðu máli í ritmál. Tækniþróun færist í þá átt að við stýrum tækjum með talskipunum, þ.e. með röddinni, í stað þess að nota fingurna.
Talgervill: Hugbúnaður sem breytir rituðum texta í talað mál, svo tækin geti bæði svarað okkur og lesið upp texta á sem eðlilegastan hátt.
Vélþýðing: Sjálfvirkar þýðingar milli íslensku og annarra tungumála sem gerðar eru af tölvu. Vélþýðingar flýta fyrir þýðingarstarfi og gera fjölbreyttari texta aðgengilega á íslensku.
Málrýnir: Hugbúnaður sem aðstoðar alla við að vinna með texta á íslensku, t.d. leiðrétta villur í stafsetningu, málfræði eða orðanotkun.
Málföng: Gagnasöfn og tól sem tengjast og nýtast í vinnu með máltækni fyrir íslensku. Þau eru meðal annars nauðsynleg til þess að greina tungumálið, safna orðaforða, finna reglur og mynstur. Nægilegt magn viðeigandi gagna og áreiðanleg stoðtól eru grunnur og forsenda allrar þróunar í máltækni.
Af hverju skiptir þetta máli?
Lífsgæðin sem við sköpum okkur í framtíðinni byggjast á menntun, rannsóknum og nýsköpun – og þeirri lykilforsendu að við höldum í við þær öru tæknibreytingar sem heimurinn færir okkur. Þess vegna verður að vera aðgengilegt að nota íslensku í hugbúnaðarþróun tæknifyrirtækja, hvort heldur þeirra stóru út í heimi eða þeirra smærri hér á Íslandi. Þá er raunin sú að tækninni í kringum okkur er í auknum mæli stýrt af tungumálinu. Þróunin er í þá átt að við munum í auknum mæli einfaldlega tala við tækin okkar. Raddstýring tækninnar færir okkur ótal tækifæri til að einfalda og bæta lífið og getur gert daglegar athafnir einfaldari og fljótlegri. Við þurfum að halda áfram að smíða, aðlaga, þróa og rækta samstarf um máltækni og gervigreind. Það er ljóst að sú vinna skilar árangri og íslenska á fullt erindi í stafræna tækni.
Gervigreindin
Árið 2017 átt sér stað hljóðlát bylting þegar AlphaZero, gervigreindarforritið sigraði Stockfish, öflugasta skákforrit í heimi. Sigur AlphaZero var afgerandi: það vann tuttugu og átta leiki, gerði sjötíu og tvö jafntefli og tapaði engu. Þessi sigur markaði tímamót í þróun á gervigreind og ljóst varð að hún yrði partur af okkar daglega lífi. Eitt af því sem liðsinnt getur framþróun tungumála eins og íslensku er ör þróun gervigreindar. Þar felast mörg tækifæri, sem flest eru ókönnuð enn. Þróun gervigreindartækni hefur verið ótrúlega hröð síðustu ár og nú eru komin fram kraftmikil kerfi sem fær eru um byltingarkennda hluti sem geta haft gríðarleg áhrif á líf fólks og samfélög. Framtíð tungumála í stafrænum heimi er samofin þróun gervigreindar. Íslenska og gervigreind þurfa hvort á öðru að halda og gervigreindarþróun á Íslandi tekur stór stökk nú þegar innan máltækniverkefna sem hér eru unnin. Enn stærri stökk verða svo tekin í samstarfi við alþjóðleg tæknifyrirtæki.
Áfram veginn
Það er markmið okkar að íslenskan eigi sér sess í þróun hugbúnaðar- og tæknilausna hjá helstu tæknifyrirtækjum heims, og að því vinnum við í góðri samvinnu. Fundirnir með fulltrúum tæknirisanna vestanhafs gengu vonum framar og voru fulltrúar þeirra margir þegar búnir að kynna sér málin vel og komu vel undirbúnir. Það kom fram á fundunum að árangur sem við höfum náð í smíði kjarnalausna getur skilað okkur víðtæku samstarfi á sviðum máltækni. Eftirfylgni með fundunum er hafin af hálfu SÍM (Samstarfs um íslenska máltækni) og sjálfseignarstofnunarinnar Almannaróms við að koma á frekari tengslum milli tæknifólks hér heima og hjá fyrirtækjunum til að stuðla að nýtingu íslensku gagnanna og samvinnu um næstu skref.
Lilja Dögg Alfreðsdóttir
menningar- og viðskiptaráðherra og varaformaður Framsóknar.
Greinin birtist fyrst á mbl.is 4. júní 2022