Verslas

2020.07.11 17:02

Tobulėjantis mašininis vertimas: ar ateityje nebereikės vertėjo profesijos?

Kamilė Gineikaitė, LRT.lt2020.07.11 17:02

Per pastarąjį dešimtmetį visame pasaulyje tobulėja mašininis (automatinis) vertėjas. Tai programos, kurios verčia tekstus. Dar prieš kelerius metus pažodžiui išverstos mašininio vertėjo frazės, praradusios prasmę kėlė juoką interneto vartotojams. Tačiau dabar technologijai tobulinti naudojamas dirbtinis intelektas ir kuriamas neuroninis mašininis vertėjas. Net ir patys vertėjai neslepia, kad dabar mašininis vertėjas keičia pačios profesijos specifiką.

Lietuvos vertimų biurų asociacijos prezidentas Dainius Sabaliauskas pasakoja, kad dar prieš dešimtmetį vertėjai nenorėjo apsiimti redaguoti tekstų, kuriuos vertė mašininis vertėjas, tačiau šiuo metu tai yra įprasta vertėjų darbo dalis.

„Dabar vis daugiau vertimų biurų užsiima mašininio vertimo redagavimu, nes jis per pastaruosius metus labai ištobulėjo. Jei kalbama apie profesionalias programas, tai vertimas yra tikrai kokybiškas. Kai trumpas sakinys, tai sunku pasakyti, kas išvertė: vertėjas, ar programa.

Nors postredagavimo (mašininio vertėjo išversto teksto redagavimo) įkainiai mažesni nei įprasto vertimo, bet, jei mašininio vertimo kokybė gana gera, vertėjas gali suredaguoti kur kas daugiau nei išverstų pats, ypač jei tekstai nesudėtingi, trumpi sakiniai (pavyzdžiui, IT tekstai). Tad ir finansiškai vertėjas neturėtų nukentėti“, – sako D. Sabaliauskas.

Pradžioje vertėjai kratėsi

D. Sabaliauskas pasakoja, kad jau po II pasaulinio karo buvo pradėtas kurti mašininis vertėjas, kuris veikė pagal tam tikrų aprašytų taisyklių rinkinius. Toks formatas nepasiteisino, o technologija kurį laiką visai nebuvo vystoma.

Prieš trisdešimt metų pradėtas kurti naujo statistinio veikimo principo mašininis vertėjas. Į šio vertėjo sistemą reikėjo sukelti kuo daugiau lygiagrečių tekstynų, o sistema, vertindama kaip statistiškai yra verčiamas kiekvienas žodis kituose tekstuose, pati parinkdavo statistiškai tiksliausia vertimą.

Įmonės „Tilde IT“, kuri užsiima mašininio vertimo technologijos kūrimu ir tobulinimu, direktorė Renata Špukienė pasakoja, kad iš pradžių vertėjai į mašininį vertimą žiūrėjo labai tiesmukiškai ir jo nenorėjo priimti kaip darbo įrankio.

„Technologija neskirta atimti iš žmonių darbo, ji skirta jiems padėti. Mašininis vertimas yra kaip įrankis, pagalbininkas profesionaliam vertėjui. Pirmasis mašininis vertimas buvo statistinis, ir jo kokybė nebuvo labai gera. Žmogui reikėjo daugiau dirbti tam, kad tas išverstas tekstas pataptų naudojamu. Šiais laikais neuroninis mašininis vertimas yra kur kas geresnės kokybės“, – sako R. Špukienė.

Be „Tilde“ taip pat laisvai prieinamos kiekvienam mašininio vertimo sistemos yra „Google“ vertėjas, „versti.eu“, „Microsoft“ vertėjas, „vertimas.vdu.lt“, Moses ir t. t.

R. Špukienė aiškino, kad tam, jog naujoji sistema verstų kokybiškai, reikia kuo daugiau tekstynų. Tačiau neuroninis mašininis vertimas ne tik statistiškai lygina žodžius, bet ir imituoja žmogaus mąstymą – sistema, matydama viso teksto kontekstą, parenka tinkamiausią vertimo variantą.

„Tu niekada negali būti tikras, ką sistema tau pasiūlys, nes ji imituoja žmogaus mąstymą. Pavyzdžiui, translator yra vertėjas. Mašina, nerasdama kaip išversti, sugalvoja kitą žodį, ir pasiūlo žodį transliatorius. Nors žodis ir nėra teisingas, tačiau šis sistemos pasiūlymas nėra blogas mąstymas, nes parinkta priesaga -orius, kaip diktorius ar panašiai, tinka žmonių profesijoms. Sistema moka nustebinti, bet ji stebina tik tada, kai neturi iš ko rinktis“, – sako įmonės vadovė.

Per dideli lūkesčiai

R. Špukienė neslepia, kad kurti mašininio vertimo technologiją mažosioms kalboms, kaip lietuvių, latvių, estų, slovakų yra kur kas sudėtingiau, nei didžiosioms, anglų, vokiečių ar prancūzų, nes šios kalbos neturi tiek daug resursų, tekstynų, kurie padėtų tobulinti technologiją. Todėl jaučiama takoskyra tarp kalbų, ir kai kurie vertėjai stebisi, kad iš vienų kalbų verčiama tiksliau, nei iš kitų.

Tam, kad mašininio vertimo sistema būtų kuo tikslesnė, kiekvienai atskirai sričiai, pavyzdžiui, medicininei, teisinei ar informacinių technologijų, sukuriama atskira sistema, kuri verčia tik tos temos tekstus.

Jeigu tu sistemos, kuri verčia apie kukurūzus, klausei apie betono maišymo sistemas, tai ji tau negali atsakyti į tokią užklausą. Kai dedi į sistemą bet ką, tai paskui ir gauni bet ką.

„Jeigu tu sistemos, kuri verčia apie kukurūzus, klausei apie betono maišymo sistemas, tai ji tau negali atsakyti į tokią užklausą. Kai dedi į sistemą bet ką, tai paskui ir gauni bet ką“, – sako R. Špukienė.

Mašininis vertėjas gali versti tik dalykinius tekstus, meninių tekstų, grožinės literatūros technologija versti negali, nes dirbtinis intelektas negali atpažinti visų meninės raiškos priemonių.

„Kūryba yra žmogaus polėkis, o tikslumas yra kūrybos priešas. Todėl sistema neskirta nei grožinei literatūrai, nei meniniams straipsniams. Jei mašininio vertimo sistemą apmokytume versti tik poeziją, galbūt tai ir pavyktų, tačiau kūryba nėra robotas, nėra programa“, – aiškina R. Špukienė. Ji mano, kad šiuos tekstus privalės versti žmogus.

Šnekos atpažinimas kartais kelia juoką

„Tilde IT“ kuria ne tik mašininio vertimo technologijas, bet ir kurią programą, kurioje įrašius savo balsą ar įkėlus garso įrašą, sistema užrašo pasakytą tekstą. Įkėlus garso įrašą reikia įrašyti savo el. pašto adresą ir po kelių minučių gaunama nuoroda, kurioje garso įrašas užrašytas žodžiais.

Kiek tai yra tikslus užrašymas? Pavyzdžiui, į sistemą įkėlus 15 sekundžių garso įrašą, kuriame R. Špukienė sako: „Žmonės galbūt kartais per daug tikisi, ir tas lūkestis būna kartais nepamatuotas, kai tu nesupranti, kaip sistema veikia. Bet jeigu tu supranti tą dalyką, tau yra paprasta naudotis.“

Sistema pateikė tokio užrašytą šio garso įrašo variantą: „Žmonės galbūt kartais per daug tikisi. Tas smūgis būna kartais nepamatuotas. Imuninės sistemos. Bet jeigu tu supranti tą dalyką.“

Verta paminėti, kad šis įrašas darytas telefonu. Pašnekovė minėjo, kad ši sistema gerai veikia tik tada, kai garso įrašas yra aukštos kokybės, o jeigu ir daromas telefonu, tai įrašoma iš labai arti, kalbama gana aiškiai.

Tačiau tiek vertėjai, tiek mašininio vertėjo kūrėjai į tobulinamas mašininio vertimo technologijas žiūri pozityviai ir tikisi, kad šis įrankis bus ir toliau naudojamas ateityje.

„Manau, į tai reikia žiūrėti teigiamai: mažės mechaninio (spausdinimo) darbo, o vertėjas vis tiek bus reikalingas, kad būtų užtikrinta nepriekaištinga vertimo kokybė“, – sako Lietuvos vertimų biurų asociacijos prezidentas D. Sabaliauskas.

Mums svarbus tikslumas ir sklandi tekstų kalba. Jei pastebėjote klaidų, praneškite portalas@lrt.lt.