Mokslas ir IT

2021.03.25 15:02

Proveržis lietuviškame internete: VDU paleido neuroninį balsą, kuris natūralumu mažai skiriasi nuo žmogaus

LRT RADIJO laida „Lietuvos diena“, LRT.lt2021.03.25 15:02

Internete neseniai atsirado naujas balsas – bet kokį lietuvišką tekstą jau dabar galima išgirsti perskaitytą sklandžia, natūraliai skambančia lietuvių kalba. Tačiau šis balsas yra ne žmogaus, o kompiuterio, kuris tekstus perskaito automatiškai, LRT RADIJUI sako Vytauto Didžiojo universiteto (VDU) Informatikos fakulteto docentas, Intelektualių sistemų laboratorijos vadovas, daktaras Darius Amilevičius.

VDU docentas tikina, kad neuroninio balso veikimą galima paaiškinti labai paprastai. „Kompiuterinė sistema gauna tekstą. Tą tekstą ji perleidžia per neuroninį tinklą ir grąžina garsinį įrašą“, – trumpai, aiškiai ir paprastai veikimo būdą apibūdina pašnekovas.


Sistemoje naudojamas konkrečios merginos balsas, intriguoja mokslininkas. Pasak jo, jei būtų kuriamas kažkoks dirbtinis balsas, tai „būtų supanašėjama į terminatorių“. „Tai nebūtų priimtinas balsas. Šiuo atveju yra imamas labai konkretus valandų skaičius konkretaus žmogaus, – teigia D. Amilevičius. – Tokiu būdu mašina yra išmokoma būtent tokiu balsu kalbėti.“

Intelektualių sistemų laboratorijos vadovas pripažįsta, kad buvo daug iššūkių kuriant neuroninį balsą. „Kaip sako prancūzai, tai atsakymas, kurio neįmanoma pateikti tarp dviejų vyno gurkšnių, – juokiasi pašnekovas. – Lietuvių kalba yra labai sudėtinga ir iš kirčiavimo taško, ir iš morfologijos taško – iš visų taškų! O dar prie to prisideda nuolatos besikeičiančios kirčiavimo taisyklės. Tai tikrai košmaras gaunasi.“

Neuroninį balsą tikimasi pritaikyti pagrinde dviems atvejams. Pasak D. Amilevičiaus, visų pirma yra siekiama, kad sistema tekstą perskaitytų sklandžiai ir gerai, ir tokiu būdu vartotojas norėtų ne skaityti, o klausyti teksto.

„Visi žinome, kad nuolatinis stebėjimas kompiuterio ekrano nėra sveikas ir žmogui priimtinas. Jis nėra ir patogus, – pastebi VDU Informatikos fakulteto docentas. – Sklandžiai perskaitantis tekstą kompiuteris yra gera pagalba neįgaliesiems, regos problemą, disleksijos problemą turintiems asmenims.

O bendrai, tai atpalaiduoja rankas nuo rašymo klaviatūra. Neuroninis balsas atpalaiduoja akis – nereikia visą laiką žiūrėti į ekraną. Tokiu būdu bendravimas su mašina tampa ganėtinai paprastesnis ir žmogui priimtinesnis. Na ir žinoma, kaip jau minėjau, neuroninis balsas išsprendžia daugybę problemų.

Na o antra taikymo sritis yra dirbtinio intelekto sritis, kada šitas sintezatorius tampa, galima sakyti, kompiuterio liežuviu.“

Šiandien dar negalima šios sistemos atsisiųsti į savo asmeninį kompiuterį ar mobilųjį telefoną. Pasak mokslininko, taip yra dėl vienos paprastos priežasties.

„Neuroninis balsas yra generuojamas su ganėtinai galinga technika. Toje technikoje yra naudojami galingi grafiniai procesoriai. Tam reikalinga tikrai nemaža mašina“, – paaiškina VDU Informatikos fakulteto docentas, Intelektualių sistemų laboratorijos vadovas, daktaras Darius Amilevičius.

Viso pokalbio su VDU daktaru D. Amilevičiumi klausykitės radijo įraše.


Parengė Vismantas Žuklevičius.

Mums svarbus tikslumas ir sklandi tekstų kalba. Jei pastebėjote klaidų, praneškite portalas@lrt.lt.