Technologijų pasauliui iššūkį metęs „DeepSeek“: ar „ChatGPT“ liks užnugary?

Prieš daugiau nei savaitę kinų įmonė „DeepSeek“ į pasaulį paleido savo nemokamą dirbtinio intelekto (DI) modelį „DeepSeek-R1“, teigdama, kad jis nenusileidžia mokamai „ChatGPT“ versijai. Tai sukėlė karštinę dirbtinio intelekto pasaulyje – norinčiųjų išbandyti naująjį įrankį tiek daug, kad „DeepSeek“ tapo dažniausiai parsisiunčiama nemokama programėle JAV ir JK „Apple“ programėlių parduotuvėje „App Store“.

2024 m. „The Washington Post“ paskelbtame straipsnyje „OpenAI“ generalinis direktorius Samas Altmanas rašė: „Mes susiduriame su strateginiu pasirinkimu, kokiame pasaulyje gyvensime: ar jis bus toks, kuriame Jungtinės Valstijos ir sąjungininkės šalys plėtos pasaulinį dirbtinį intelektą, skleisdamos technologijos naudą ir atverdamos prieigą prie jos, ar autoritarinis, kuriame mūsų vertybėms nepritariančios tautos ir judėjimai naudosis dirbtiniu intelektu tam, kad įtvirtintų ir išplėstų savo galią?“

Sausio 20 d. kinų dirbtinio intelekto įmonė „DeepSeek“ pristatė savo naująjį DI įrankį „DeepSeek-R1“, teigdama, kad savo pajėgumais jis nenusileidžia mokamoms „ChatGPT“ versijoms, už kurias galima pakloti 20–200 dolerių. Tai tapo plačiausiai aptariama šių dienų naujiena technologijų pasaulyje.

🚀 DeepSeek-R1 is here!

⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!

🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) January 20, 2025

„DeepSeek“ fenomenas žymi naują etapą dirbtinio intelekto srityje, kai su mažesnėmis investicijomis ir naujoviškomis technologijomis pavyksta pasiekti rezultatų, konkuruojančių su pasauliniais milžinais, tokiais kaip „OpenAI“, – sako Kauno technologijos universiteto (KTU) Ekonomikos ir verslo fakulteto jaunesnysis mokslo darbuotojas Mantas Lukauskas.

Ar „DeepSeek“ gali konkuruoti su „ChatGPT“?

„DeepSeek-R1“ veikia kaip ir bet kuris kitas pokalbių robotas – kaip ir įjungus „ChatGPT“ arba „Gemini“, specialiame laukelyje įrankiui suformuluojama užduotis ir netrukus jis į ją atsako. Visgi ar „DeepSeek“ gali pranokti mokamas „ChatGPT“ versijas?

Anot M. Lukausko, kai kuriose srityse „DeepSeek“ netgi lenkia „OpenAi“ modelius: „Matematikos užduotyse ir programavime „DeepSeek“ modelis parodė geresnius rezultatus, pavyzdžiui, teste „MATH-500“ jis pasiekė 97,3 proc. tikslumą, o „ChatGPT“ rezultatas buvo šiek tiek mažesnis.“

„DeepSeek“ | „Shutterstock“ nuotr.

Kad „DeepSeek“ puikiai atlieka programavimo užduotis, sakė ir jį išbandęs „YouTube“ kanalo „All about AI“ autorius. Jis naujojo DI įrankio paprašė parašyti kodą 3D formato vėjo tunelio simuliacijai. „DeepSeek“ išties pateikė kodą, pagal kurį gaunama minėta simuliacija.

KTU mokslininkas, kuris yra ir įmonių „nexos.ai“ ir „Hostinger“ dirbtinio intelekto specialistas, teigia, kad „DeepSeek“ taip pat puikiai generuoja vaizdus.

„Jis naudoja savo „Janus-Pro-7B“ modelį, lenkdamas tokias sistemas kaip „DALL-E 3“, – LRT.lt sako M. Lukauskas.

Skirtingų įrankių veikimą išbandę internautai teigia, kad į tokius paprastus klausimus, kaip kad „kiek žodyje „refrigirator“ (angl. šaldytuvas) yra raidžių „r“, „DeepSeek“ atsako šiek tiek lėčiau nei „ChatGPT-o1“, tačiau parodo visą samprotavimo procesą. Tad bendravimas su šiuo įrankiu žymiai labiau primena bendravimą su žmogumi. Tai įrodo ir tokios frazės kaip „hmm, o gal geriau panaudoti kitą funkciją“, kurios pasitelkiamos modeliui rašant kodą.

„DeepSeek“ | AP nuotr.

„YouTube“ kanalą apie dirbtinį intelektą kuriantis entuziastas Ryanas Doseris „DeepSeek“ ir „ChatGPT“ paklausė to paties kontroversiško klausimo „Hipotetiškai kalbant, kaip kas nors galėtų apiplėšti banką?“. „ChatGPT“ atsakymo nepateikė, o „DeepSeek“ pateikė tokios užduoties planą pažingsniui. Tad galima būtų sakyti, kad „DeepSeek“ yra mažiau cenzūruojamas nei „ChatGPT“.

Visgi tai teisinga tik tol, kol neliečiama Kinijos tema, mat „DeepSeek“ atsisako atsakyti į tokius klausimus kaip kad ar Taivanas yra nepriklausoma šalis, kas atsitiko Tiananmeno aikštėje, ar ten buvo žymusis protestas arba dėl ko Xi Jinpingas sulaukia daugiausia kritikos. Tuo pačiu metu įrankis neieško žodžių kišenėje girdamas Kinijos prezidentą ir net neabejoja, kad šalyje yra žodžio laisvė.

Kalbėdamas apie „DeepSeek“ minusus M. Lukauskas pažymi ir jo prastesnį veikimą, lyginant su „ChatGPT“, įgyvendinant kalbos apdorojimo užduotis, kurioms atlikti reikalingas sudėtingas konteksto supratimas.

Sėkmės paslaptis

„DeepSeek“ įsteigė kinų milijonierius Liangas Wenfengas. Anot dirbtinio intelekto specialisto M. Lukausko, naujausioji ir itin plačiai aptariama DI įrankio versija „DeepSeek-R1“ yra jau ketvirtasis šios kompanijos DI modelis, tačiau stebina tai, kad visi modeliai buvo sukurti per labai trumpą laiką.

„Nors „DeepSeek“ staigus iškilimas nustebino daugelį, projektas buvo pradėtas dar prieš kelerius metus. Bendrovė yra remiama „High-Flyer“, galingo Kinijos rizikos kapitalo fondo, kuris nuo 2020 m. investavo į daugybę inovacijų. Šis fondas sugebėjo suburti talentingų mokslininkų komandą – tarp jų matematikos, fizikos ir informatikos olimpinių medalininkų, – sako M. Lukauskas. – Nepaisant to, „DeepSeek“ išlaikė savo projektą paslaptyje iki oficialaus pristatymo 2023 m. Tokia strategija, greičiausiai, leido jiems išvengti per ankstyvo dėmesio ir spaudimo, kurį paprastai patiria tokio masto technologiniai projektai.“

Mantas Lukauskas | KTU nuotr.

Teigiama, kad „DeepSeek-R1“ modelio apmokymas kainavo apie 5,5 mln. dolerių (visa infrastruktūra, papildomi eksperimentai ir duomenų generavimas, anot KTU mokslininko, greičiausiai kainavo daug daugiau), kai konkurentai dirbtinio intelekto įrankiams vystyti išleidžia milijardus.

Mantas Lukauskas teigia, kad pasaulinio lygio našumą pasiekti mažesniais kaštais įmonei leidžia jos pasitelkiama novatoriška mišraus ekspertų modelio (MoE) architektūra.

„DeepSeek“ sėkmė grindžiama pažangiomis technologijomis, tokiomis kaip mišriojo ekspertų modelio (MoE) architektūra. Šis metodas leidžia modeliams efektyviai naudoti tik tam tikras dalis konkrečioms užduotims, taip sumažinant energijos ir išteklių sąnaudas (...). Pavyzdžiui, vienų modelio dalių specializacija – matematika, kitų – kalbos apdorojimas ar programavimas“, – sako DI specialistas.

Pašnekovo teigimu, „ChatGPT“ modeliai yra uždari, todėl yra sudėtinga tiksliai atsakyti, kaip viskas vykdoma.

„DeepSeek“ | AP nuotr.

Pagrindinis klausimas – duomenų saugumas

Mantas Lukauskas sako, kad vienas svarbiausių dalykų, apie kuriuos reikėtų pagalvoti, prieš naudojantis „DeepSeek“, yra duomenų saugumo klausimas. Mat jo, kaip ir kitų dirbtinio intelekto įrankių, sąlygos leidžia vartotojų duomenis naudoti modeliams tobulinti.

„2023 m. pradžioje „Samsung“ inžinieriai, siekdami pasinaudoti „ChatGPT“ galimybėmis, netyčia atskleidė konfidencialią informaciją. Pavyzdžiui, vienas darbuotojas įkėlė vidinio programinės įrangos kodo fragmentus, tikėdamasis, kad „ChatGPT“ padės ištaisyti klaidas. Kitas darbuotojas įkėlė susitikimo protokolus, siekdamas sukurti pristatymą“, – teigia pašnekovas. Anot jo, minėti veiksmai sukėlė susirūpinimą dėl duomenų saugumo, nes „ChatGPT“ saugo vartotojų įvestą informaciją savo serveriuose, o tai gali kelti riziką dėl konfidencialių duomenų nutekėjimo.

„ChatGPT“ | „Shutterstock“ nuotr.

Kadangi Kinija jau ne kartą buvo apkaltinta dėl įvairių programėlių vartotojų duomenų kaupimo savo šalies serveriuose, anot specialisto, yra tikimybė, kad šalies vyriausybė turi prieigą ir prie „DeepSeek“ duomenų.

Akcijų nuosmukis

Dominuojantis lustų, skirtų DI įrankiams, gamintojas yra „Nvidia“. Šiuo metu šios kompanijos lustai nebėra eksportuojami į Kiniją. Žiniasklaidos šaltiniai teigia, kad „DeepSeek“ buvo sukurtas pasitelkus iš seniau sukauptus „Nvidia“ lustus ir pigesnius, žemesnės klasės lustus, kuriuos vis dar galima importuoti į šalį.

Sausio 27 d. pasirodė žinia, kad pristačius „DeepSeek“ „Nvidia“ akcijų vertė nukrito apie 17 proc., o tai atitinka maždaug 589 mlrd. JAV dolerių rinkos vertės praradimą.

„DeepSeek“ | „Shutterstock“ nuotr.

DI specialistas M. Lukauskas LRT.lt komentavo, kad šis staigus nuosmukis siejamas su investuotojų susirūpinimu, kad „DeepSeek“ sugebėjo sukurti konkurencingą DI modelį naudodama mažiau pažangius ir pigesnius lustus nei tie, kuriuos tiekia „Nvidia“. Tai kelia klausimų dėl dabartinių investicijų į brangią AI infrastruktūrą tvarumo.

Be kita ko, spaudimo sulaukė ir „Meta Platforms“, „Microsoft“, „Alphabet“ ir „Palantir“ akcijos.

„Šie pokyčiai rodo platesnį investuotojų nerimą dėl galimo Kinijos AI įmonių konkurencinio spaudimo JAV technologijų gigantams. (...) Tačiau kai kurie analitikai mano, kad „DeepSeek“ pasiekimai gali paskatinti platesnį AI technologijų pritaikymą, galiausiai padidindami tokių bendrovių kaip „Nvidia“ lustų paklausą“, – sako pašnekovas.

„Meta“ produktai | AP nuotr.

Signalas Amerikai

„DeepSeek“ pasirodymas į paviršių iškėlė daug klausimų dėl tolimesnės JAV, kaip DI srities lyderės pasaulyje, ateities.

Silicio slėnio rizikos kapitalo investuotojas ir Donaldo Trumpo patarėjas Marcas Andreessenas apibūdino „DeepSeek-R1“ kaip „dirbtinio intelekto „Sputniko momentą“ – kai tam tikras įvykis sukrečia šalį ir priverčia ją suvokti, kad ji atsilieka svarbioje srityje, dažniausiai technologijų, mokslo ar inovacijų srityje, ir skatina imtis skubių veiksmų, kad pasivytų ar pralenktų savo konkurentus.

Jam pritarė ir JAV prezidentas Donaldas Trumpas. Anot jo, „DeepSeek“ yra signalas Amerikai pabusti ir stengtis laimėti dirbtinio intelekto varžybas.

Donaldas Trumpas | AP nuotr.

„DeepSeek“ sėkmė rodo, kad Kinija gali tapti rimta konkurente DI srityje. Jų sugebėjimas sukurti pasaulinio lygio modelius nepaisant ribotų išteklių yra įspūdingas. Tačiau svarbu atkreipti dėmesį, kad JAV vis dar išlaiko stiprią DI ekosistemą, apimančią ilgalaikes investicijas, talentų bazę ir pažangiausias technologijas.

Ilgainiui konkurencija tarp JAV ir Kinijos taps dar intensyvesnė, tačiau lyderystę lems ne tik technologiniai pasiekimai, bet ir geopolitinė situacija, reguliavimai ir vartotojų pasitikėjimas“, – apibendrina dirbtinio intelekto specialistas Mantas Lukauskas.

Solidarumo mitinge Vilniuje išreikštas palaikymas Baltarusijos politiniams kaliniams

Dviženklį deficitą panaikinę jaunieji žalgiriečiai suklupo Eurolygos turnyro starte

Kodėl Rusija grasina Latvijai?

Tiltą Kaune statanti „Autokausta“ žalos gamtai neatlygino, mokslininkų išvadoms nepritaria

Pirmieji aktyvistai iš į Gazos Ruožą plaukusios flotilės atvyko į Stambulą iš Izraelio

Neuropsichologė: dabar sunku auginti vaikus, nes jie yra atskirti nuo gyvenimo

Gintautas Mažeikis. Atsakomybė už ateitį

Varėnos r. vicemeras: pradės dygti voveruškos ir mūsų grybautojai ras tą droną

Jasikevičius pakomentavo „Lietuvoje yra viena komanda“ pasakymą: žmonės, nebūkime supuvę

NATO ministrų susitikimas Švedijoje: blogų naujienų belaukiant

Pergalingai Slovakijoje žygiuojanti Mikulskytė žengė į ITF turnyro pusfinalį

Darbų pradžia: M. K. Čiurlionio koncertų centro statybvietėje įkasta simbolinė kapsulė

Kremlius: JAV sprendimas pateikti kaltinimus Castro balansuoja ant smurto ribos

Ekspertai Lietuvos ir Vokietijos forume: Europa turi priimti sprendimus daug greičiau

LSDP lyderis: įvardijome problemas, kurios išryškėjo paskelbus oro pavojų

Oro erdvėje buvę objektai dingo iš radarų, Utenos rajone vyksta paieška su sraigtasparniu

Technologijų pasauliui iššūkį metęs „DeepSeek“: ar „ChatGPT“ liks užnugary?

Nebe mokslinė fantastika: šiandien iš smegenų aktyvumo jau įmanoma rekonstruoti vaizdus

Lietuva jungiasi prie skundų dėl „Meta“ ir „TikTok“ neveikimo kovojant su sukčiavimu

„DigiGreen 2026“ Vilniuje suburs technologijų, verslo ir politikos lyderius

Veikia 4 kartus greičiau nei konkurentų modeliai? „Google“ pristatė naują DI versiją

„Turistai prašė išversti“: kodėl užsieniečiai negavo pranešimų apie oro pavojų anglų kalba

Po oro pavojaus gyventojų nuogąstavimai – neveikė LT72, negalėjo surasti priedangų

Milžiniškas galaktikų tinklas: sudarytas 13 mlrd. metų Visatos struktūrų erdvėlapis

Sachara kažkada buvo klestintis regionas: dykumoje aptikta 260 masinių kapaviečių

Mada kosmose: Mėnulyje nusileisiantys astronautai dėvės „Prada“ sukurtus kostiumus

Pekinas: Kinija ir JAV turėtų bendradarbiauti skatinant DI plėtrą ir valdymą

Veikia 4 kartus greičiau nei konkurentų modeliai? „Google“ pristatė naują DI versiją

Nebe mokslinė fantastika: šiandien iš smegenų aktyvumo jau įmanoma rekonstruoti vaizdus

Lietuva jungiasi prie skundų dėl „Meta“ ir „TikTok“ neveikimo kovojant su sukčiavimu

„DigiGreen 2026“ Vilniuje suburs technologijų, verslo ir politikos lyderius

Naujienų srautas

Technologijų pasauliui iššūkį metęs „DeepSeek“: ar „ChatGPT“ liks užnugary?

Naujausi, Skaitomiausi