Naujienų srautas

Mokslas ir IT2025.01.28 19:30

Technologijų pasauliui iššūkį metęs „DeepSeek“: ar „ChatGPT“ liks užnugary?

00:00
|
00:00
00:00

Prieš daugiau nei savaitę kinų įmonė „DeepSeek“ į pasaulį paleido savo nemokamą dirbtinio intelekto (DI) modelį „DeepSeek-R1“, teigdama, kad jis nenusileidžia mokamai „ChatGPT“ versijai. Tai sukėlė karštinę dirbtinio intelekto pasaulyje – norinčiųjų išbandyti naująjį įrankį tiek daug, kad „DeepSeek“ tapo dažniausiai parsisiunčiama nemokama programėle JAV ir JK „Apple“ programėlių parduotuvėje „App Store“.

2024 m. „The Washington Post“ paskelbtame straipsnyje „OpenAI“ generalinis direktorius Samas Altmanas rašė: „Mes susiduriame su strateginiu pasirinkimu, kokiame pasaulyje gyvensime: ar jis bus toks, kuriame Jungtinės Valstijos ir sąjungininkės šalys plėtos pasaulinį dirbtinį intelektą, skleisdamos technologijos naudą ir atverdamos prieigą prie jos, ar autoritarinis, kuriame mūsų vertybėms nepritariančios tautos ir judėjimai naudosis dirbtiniu intelektu tam, kad įtvirtintų ir išplėstų savo galią?“

Sausio 20 d. kinų dirbtinio intelekto įmonė „DeepSeek“ pristatė savo naująjį DI įrankį „DeepSeek-R1“, teigdama, kad savo pajėgumais jis nenusileidžia mokamoms „ChatGPT“ versijoms, už kurias galima pakloti 20–200 dolerių. Tai tapo plačiausiai aptariama šių dienų naujiena technologijų pasaulyje.

„DeepSeek“ fenomenas žymi naują etapą dirbtinio intelekto srityje, kai su mažesnėmis investicijomis ir naujoviškomis technologijomis pavyksta pasiekti rezultatų, konkuruojančių su pasauliniais milžinais, tokiais kaip „OpenAI“, – sako Kauno technologijos universiteto (KTU) Ekonomikos ir verslo fakulteto jaunesnysis mokslo darbuotojas Mantas Lukauskas.

Ar „DeepSeek“ gali konkuruoti su „ChatGPT“?

„DeepSeek-R1“ veikia kaip ir bet kuris kitas pokalbių robotas – kaip ir įjungus „ChatGPT“ arba „Gemini“, specialiame laukelyje įrankiui suformuluojama užduotis ir netrukus jis į ją atsako. Visgi ar „DeepSeek“ gali pranokti mokamas „ChatGPT“ versijas?

Anot M. Lukausko, kai kuriose srityse „DeepSeek“ netgi lenkia „OpenAi“ modelius: „Matematikos užduotyse ir programavime „DeepSeek“ modelis parodė geresnius rezultatus, pavyzdžiui, teste „MATH-500“ jis pasiekė 97,3 proc. tikslumą, o „ChatGPT“ rezultatas buvo šiek tiek mažesnis.“

Kad „DeepSeek“ puikiai atlieka programavimo užduotis, sakė ir jį išbandęs „YouTube“ kanalo „All about AI“ autorius. Jis naujojo DI įrankio paprašė parašyti kodą 3D formato vėjo tunelio simuliacijai. „DeepSeek“ išties pateikė kodą, pagal kurį gaunama minėta simuliacija.

KTU mokslininkas, kuris yra ir įmonių „nexos.ai“ ir „Hostinger“ dirbtinio intelekto specialistas, teigia, kad „DeepSeek“ taip pat puikiai generuoja vaizdus.

„Jis naudoja savo „Janus-Pro-7B“ modelį, lenkdamas tokias sistemas kaip „DALL-E 3“, – LRT.lt sako M. Lukauskas.

Skirtingų įrankių veikimą išbandę internautai teigia, kad į tokius paprastus klausimus, kaip kad „kiek žodyje „refrigirator“ (angl. šaldytuvas) yra raidžių „r“, „DeepSeek“ atsako šiek tiek lėčiau nei „ChatGPT-o1“, tačiau parodo visą samprotavimo procesą. Tad bendravimas su šiuo įrankiu žymiai labiau primena bendravimą su žmogumi. Tai įrodo ir tokios frazės kaip „hmm, o gal geriau panaudoti kitą funkciją“, kurios pasitelkiamos modeliui rašant kodą.

„YouTube“ kanalą apie dirbtinį intelektą kuriantis entuziastas Ryanas Doseris „DeepSeek“ ir „ChatGPT“ paklausė to paties kontroversiško klausimo „Hipotetiškai kalbant, kaip kas nors galėtų apiplėšti banką?“. „ChatGPT“ atsakymo nepateikė, o „DeepSeek“ pateikė tokios užduoties planą pažingsniui. Tad galima būtų sakyti, kad „DeepSeek“ yra mažiau cenzūruojamas nei „ChatGPT“.

Visgi tai teisinga tik tol, kol neliečiama Kinijos tema, mat „DeepSeek“ atsisako atsakyti į tokius klausimus kaip kad ar Taivanas yra nepriklausoma šalis, kas atsitiko Tiananmeno aikštėje, ar ten buvo žymusis protestas arba dėl ko Xi Jinpingas sulaukia daugiausia kritikos. Tuo pačiu metu įrankis neieško žodžių kišenėje girdamas Kinijos prezidentą ir net neabejoja, kad šalyje yra žodžio laisvė.

Kalbėdamas apie „DeepSeek“ minusus M. Lukauskas pažymi ir jo prastesnį veikimą, lyginant su „ChatGPT“, įgyvendinant kalbos apdorojimo užduotis, kurioms atlikti reikalingas sudėtingas konteksto supratimas.

Sėkmės paslaptis

„DeepSeek“ įsteigė kinų milijonierius Liangas Wenfengas. Anot dirbtinio intelekto specialisto M. Lukausko, naujausioji ir itin plačiai aptariama DI įrankio versija „DeepSeek-R1“ yra jau ketvirtasis šios kompanijos DI modelis, tačiau stebina tai, kad visi modeliai buvo sukurti per labai trumpą laiką.

„Nors „DeepSeek“ staigus iškilimas nustebino daugelį, projektas buvo pradėtas dar prieš kelerius metus. Bendrovė yra remiama „High-Flyer“, galingo Kinijos rizikos kapitalo fondo, kuris nuo 2020 m. investavo į daugybę inovacijų. Šis fondas sugebėjo suburti talentingų mokslininkų komandą – tarp jų matematikos, fizikos ir informatikos olimpinių medalininkų, – sako M. Lukauskas. – Nepaisant to, „DeepSeek“ išlaikė savo projektą paslaptyje iki oficialaus pristatymo 2023 m. Tokia strategija, greičiausiai, leido jiems išvengti per ankstyvo dėmesio ir spaudimo, kurį paprastai patiria tokio masto technologiniai projektai.“

Teigiama, kad „DeepSeek-R1“ modelio apmokymas kainavo apie 5,5 mln. dolerių (visa infrastruktūra, papildomi eksperimentai ir duomenų generavimas, anot KTU mokslininko, greičiausiai kainavo daug daugiau), kai konkurentai dirbtinio intelekto įrankiams vystyti išleidžia milijardus.

Mantas Lukauskas teigia, kad pasaulinio lygio našumą pasiekti mažesniais kaštais įmonei leidžia jos pasitelkiama novatoriška mišraus ekspertų modelio (MoE) architektūra.

„DeepSeek“ sėkmė grindžiama pažangiomis technologijomis, tokiomis kaip mišriojo ekspertų modelio (MoE) architektūra. Šis metodas leidžia modeliams efektyviai naudoti tik tam tikras dalis konkrečioms užduotims, taip sumažinant energijos ir išteklių sąnaudas (...). Pavyzdžiui, vienų modelio dalių specializacija – matematika, kitų – kalbos apdorojimas ar programavimas“, – sako DI specialistas.

Pašnekovo teigimu, „ChatGPT“ modeliai yra uždari, todėl yra sudėtinga tiksliai atsakyti, kaip viskas vykdoma.

Pagrindinis klausimas – duomenų saugumas

Mantas Lukauskas sako, kad vienas svarbiausių dalykų, apie kuriuos reikėtų pagalvoti, prieš naudojantis „DeepSeek“, yra duomenų saugumo klausimas. Mat jo, kaip ir kitų dirbtinio intelekto įrankių, sąlygos leidžia vartotojų duomenis naudoti modeliams tobulinti.

„2023 m. pradžioje „Samsung“ inžinieriai, siekdami pasinaudoti „ChatGPT“ galimybėmis, netyčia atskleidė konfidencialią informaciją. Pavyzdžiui, vienas darbuotojas įkėlė vidinio programinės įrangos kodo fragmentus, tikėdamasis, kad „ChatGPT“ padės ištaisyti klaidas. Kitas darbuotojas įkėlė susitikimo protokolus, siekdamas sukurti pristatymą“, – teigia pašnekovas. Anot jo, minėti veiksmai sukėlė susirūpinimą dėl duomenų saugumo, nes „ChatGPT“ saugo vartotojų įvestą informaciją savo serveriuose, o tai gali kelti riziką dėl konfidencialių duomenų nutekėjimo.

Kadangi Kinija jau ne kartą buvo apkaltinta dėl įvairių programėlių vartotojų duomenų kaupimo savo šalies serveriuose, anot specialisto, yra tikimybė, kad šalies vyriausybė turi prieigą ir prie „DeepSeek“ duomenų.

Akcijų nuosmukis

Dominuojantis lustų, skirtų DI įrankiams, gamintojas yra „Nvidia“. Šiuo metu šios kompanijos lustai nebėra eksportuojami į Kiniją. Žiniasklaidos šaltiniai teigia, kad „DeepSeek“ buvo sukurtas pasitelkus iš seniau sukauptus „Nvidia“ lustus ir pigesnius, žemesnės klasės lustus, kuriuos vis dar galima importuoti į šalį.

Sausio 27 d. pasirodė žinia, kad pristačius „DeepSeek“ „Nvidia“ akcijų vertė nukrito apie 17 proc., o tai atitinka maždaug 589 mlrd. JAV dolerių rinkos vertės praradimą.

DI specialistas M. Lukauskas LRT.lt komentavo, kad šis staigus nuosmukis siejamas su investuotojų susirūpinimu, kad „DeepSeek“ sugebėjo sukurti konkurencingą DI modelį naudodama mažiau pažangius ir pigesnius lustus nei tie, kuriuos tiekia „Nvidia“. Tai kelia klausimų dėl dabartinių investicijų į brangią AI infrastruktūrą tvarumo.

Be kita ko, spaudimo sulaukė ir „Meta Platforms“, „Microsoft“, „Alphabet“ ir „Palantir“ akcijos.

„Šie pokyčiai rodo platesnį investuotojų nerimą dėl galimo Kinijos AI įmonių konkurencinio spaudimo JAV technologijų gigantams. (...) Tačiau kai kurie analitikai mano, kad „DeepSeek“ pasiekimai gali paskatinti platesnį AI technologijų pritaikymą, galiausiai padidindami tokių bendrovių kaip „Nvidia“ lustų paklausą“, – sako pašnekovas.

Signalas Amerikai

„DeepSeek“ pasirodymas į paviršių iškėlė daug klausimų dėl tolimesnės JAV, kaip DI srities lyderės pasaulyje, ateities.

Silicio slėnio rizikos kapitalo investuotojas ir Donaldo Trumpo patarėjas Marcas Andreessenas apibūdino „DeepSeek-R1“ kaip „dirbtinio intelekto „Sputniko momentą“ – kai tam tikras įvykis sukrečia šalį ir priverčia ją suvokti, kad ji atsilieka svarbioje srityje, dažniausiai technologijų, mokslo ar inovacijų srityje, ir skatina imtis skubių veiksmų, kad pasivytų ar pralenktų savo konkurentus.

Jam pritarė ir JAV prezidentas Donaldas Trumpas. Anot jo, „DeepSeek“ yra signalas Amerikai pabusti ir stengtis laimėti dirbtinio intelekto varžybas.

„DeepSeek“ sėkmė rodo, kad Kinija gali tapti rimta konkurente DI srityje. Jų sugebėjimas sukurti pasaulinio lygio modelius nepaisant ribotų išteklių yra įspūdingas. Tačiau svarbu atkreipti dėmesį, kad JAV vis dar išlaiko stiprią DI ekosistemą, apimančią ilgalaikes investicijas, talentų bazę ir pažangiausias technologijas.

Ilgainiui konkurencija tarp JAV ir Kinijos taps dar intensyvesnė, tačiau lyderystę lems ne tik technologiniai pasiekimai, bet ir geopolitinė situacija, reguliavimai ir vartotojų pasitikėjimas“, – apibendrina dirbtinio intelekto specialistas Mantas Lukauskas.

LRT yra žiniasklaidos priemonė, sertifikuota pagal tarptautinę Žurnalistikos patikimumo iniciatyvos programą

Naujausi, Skaitomiausi