Mokslas ir IT

2020.09.15 12:08

Vienos universiteto mokslininkas Ronald Hochreiter apie didžiuosius duomenis: daugiau ne visada geriau

LRT.lt2020.09.15 12:08

Niekam ne paslaptis, kad didieji duomenys (angl. Big Data) yra vienas svarbiausių šiuolaikinių verslų variklių ir daugelis įmonių žino, ko galima siekti ir ką pasiekti juos protingai „įdarbinus“. Teoriškai viskas skamba puikiai. Bet ar tikrai visi žino, kaip tai padaryti?

Kad teorija ir praktika žygiuotų darniai koja kojon, reikia daug mokytis. Mokytis reikia ir vadovams, ir patiems duomenų specialistams. Didžiųjų duomenų (ir čia turėkime minty ne tik pačius duomenis, bet ir didžiųjų duomenų metodus ir technologijas) sritis keičiasi labai sparčiai, tad ir įmonės turi sparčiai prie tų pokyčių prisitaikyti, rašoma pranešime žiniasklaidai.

„Ko gero dabar sunkiai berastume sektorių, kuriame tinkamas duomenų analizės procesas neatneštų aiškios ir pamatuojamos naudos ar konkurencinio pranašumo. Tačiau reikia suprasti, kad svarbu yra ne tai, kiek duomenų, bet kokie duomenys, ir svarbiausia – turėti sumanių specialistų tiems duomenims tvarkyti. Tik jų dėka galima priimti reikšmingus duomenimis grįstus sprendimus“, – įsitikinęs vienas iš šių metų „KTU Big Data School“ lektorių Vienos universiteto mokslininkas Ronald Hochreiter.

Daugiau = geriau?

Duomenų kiekiai kasdien vis auga ir augs ateityje. Ar iš tų sunkiai suvokiamų duomenų srautų apimčių galima ištraukti prasmę? „Taip, tik turėkime minty, kad daugiau ne visada yra geriau“, – tvirtina mokslininkas.

Pasak R. Hochreiter, nemažai didžiųjų duomenų analitikos (DDA) projektų būna nesėkmingi, nes žmonės linkę manyti, kad į sistemą įvedus daugiau duomenų, rezultatai bus geresni, t. y. daugeliu atvejų, kai nėra aiškios struktūros, kuriai buvo sukurti mašininio mokymosi modeliai, daugiau duomenų reiškia mažiau reikšmingus rezultatus.

„Modeliai turėtų būti kiek įmanoma mažesni (ypač atsižvelgiant į įvairių panaudojamų požymių skaičių), o automatinių požymių konstravimo metodų geriau apskritai vengti“, – pataria mokslininkas.

Tobulėjimas yra raktas

Šiuolaikinis verslas išties turi daug žinių apie DDA ir supranta, kokią naudą tai gali jiems atnešti. Supranta ir tai, kad labai svarbu tobulėti. Bet, pasak mokslininko, nepakanka visus darbuotojus tiesiog išsiųsti į internetinius kursus – labai svarbu yra praktiniai mokymai, susiję su realiais atvejais įmonėse.

„Pavyzdžiui, investicijų bankas „J. P.Morgan“ dar 2017 m. pateikė savo ataskaitoje, kad žymiai lengviau išmokyti domenų ekspertus dirbtinio intelekto (DI), nei paaiškinti DI guru gana komplikuotas domeno žinias, kurioms giliai suprasti reikia daug metų praktikos“, – kalba R. Hochreiter.

DDA žymiai paveikė tradicinius verslo, gamybos ar viešojo sektoriaus procesus. Ir didžiausią naudą, pasak mokslininko, ateity turės tos įmonės, kur tinkami, t. y. sumanūs specialistai analizuoja ir interpretuoja teisingus/kokybiškus duomenis.

Rizikų neišvengsime

Duomenims, duomenų analitikai ir DI vis labiau skverbiantis į verslus ir mūsų gyvenimus apskritai, pradedama įžvelgti įvairių rizikų. Apie DI etiką ir teisinį reguliavimą kalbama jau kurį laiką, tačiau R. Hochreiter siūlo pažvelgti į tai dar kitu kampu.

Pasak mokslininko, žalinga aklai tikėti metodais, o taip pat ir žmonėmis, kurie be jokios kritikos tiki tuo, ką „ypatingai fantastiškas“ gilusis tinklas ar „XGBoost“ (labai populiarus įvairiuose taikymuose metodas) jam suskaičiuoja. Nereikia aklai pasitikėti ir įvairiais tikslumo matais, kurie neretai pernelyg optimistiškai nuteikia dėl vienokio ar kitokio verslo sprendimo sėkmės.

„Didelė rizika yra ta, kad dažnai verslo žmonės nelinkę pripažinti, jog tikrasis iššūkis yra netrumpas laiko intervalas, reikalingas analitinių modelių rezultatų pavertimui į prasmingą verslo procesą gerinantį sprendimą“, – apie iššūkius DDA srityje svarsto R. Hochreiter.