Meteorski rast za nikad kraće vrijeme napravio je od DeepSeek-a prilično jakog konkurenta velikim igračima kao što su OpenAI, Google i Microsoft, pogotovo zbog toga što je kineski četbot stvoren sa mnogo manje novca i hardvera

Jedna, do skoro gotovo nepoznata kineska kompanija, koja se bavi vještačkom inteligencijom (AI), posljednjih dana je napravila prilično veliku pometnju u američkoj tehnološkoj industriji.
Startap DeepSeek, sa sjedištem u Hangdžouu, koga je u maju 2023. godine osnovao kineski milijarder Liang Venfeng, napravio je AI pomoćnika koji je nedavno "zbacio sa trona" popularni ChatGPT, američke kompanije OpenAI, i time postao najbolje ocijenjena besplatna aplikacija u Apple-ovoj App Store prodavnici u SAD.
AI četbot DeepSeek-R1, ocijenjen kao velika prekretnica u razvoju jezičkih modela vještačke inteligencije, predstavljen je u prvim danima ova godine. Na američko tržište aplikacije zvanično je stigao 10. januara, i za samo petnaestak dana uspio da postane toliko popularan da je ozbiljno zabrinuo sve rivale, kakvi su GPT-4o i OpenAI o1.
Meteorski rast za kratko vrijeme je od DeepSeek-a napravio prilično jakog konkurenta velikim igračima kao što su, već pomenuti OpenAI, ali i Google i Microsoft, iz koga je kineskom konkurentu i došlo jedno od prvih priznanja. Upravo je direktor tehnološkog giganta iz Redmonda Satja Nadela je ocijenio da je novi AI model "impresivan kako u pogledu efikasnog otvorenog koda, tako i u pogledu vremena zaključivanja i izuzetne kompjuterske efikasnosti".
Identični rezultati – 10 puta manje para
DeepSeek-R1 je zasnovan na prethodnom jezičkom modelu DeepSeek-V3, predstavljenom u decembru, za koga njegovi programeri tvrde da je "na vrhu liste jezičkih modela otvorenog koda i da se na globalnom nivou ravnopravno takmiči sa najnaprednijim modelima zatvorenog koda".
Testiran na referentnim testovima koje koriste američke AI kompanije, četbot je odgovarao na pitanja, rješavao logičke probleme i pisao kompjuterske programe jednako sposobno kao i bilo koja slična, mnogo poznatija AI aplikacija.
Iako podjednako konkurentan, kineski četbot je stvoren sa mnogo manje ulaganja od konkurencije, čime je ozbiljno izazvao dominantnu ideju da su samo najveće tehnološke kompanije, sve sa sjedištem u SAD, mogu da priušte razvoje jednog tako naprednog sistema.
Kineski inženjeri, naime, tvrde da je u izgradnju njihovog novog AI sistema uloženo "samo oko šest miliona dolara sirove računarske snage". To gotovo 10 puta manje nego što je američki tehnološki gigant Meta uložio u razvoj svoje najnovije AI tehnologije.
Isti efekat – 8 puta manje čipova
Druga stvar koja iznenađuje Amerikance je tvrdnja inženjera DeepSeek-a da su koristili samo djelić visoko specijalizovanih čipova na koje se vodeće tehnološke kompanije oslanjaju u obuci svojih AI sistema.
Inače, upravo su moćni AI čipovi u centru napete konkurentske tehnološke bitke između SAD i Kine, zbog koje američke vlasti preduzimaju sve više mjera sa ciljem da zadrže vodeću poziciju u globalnoj AI trci. Jedan od načina na koji to pokušavaju da postignu upravo je ograničavanje količine čipova, među kojima su najpoznatiji oni koje proizvodi Nvidia, koji mogu biti prodati Kini i drugim rivalima.
A upravo su takve mjere "okidač" koji je primorao kineske sturčnjake da budu kreativni u primeni različitih sredstava. Svoj AI model DeepSeek jeste obučio koristeći Nvidia H800 čipove, što je tvrdnja koja se našla u središtu žestoke debate unutar tehnološke zajednice, kao i uz pomoć širokog spektra alata koji su besplatno dostupni na internetu.
Međutim, dok vodeće svjetske AI kompanije svoje četbotove obučavaju koristeći superkompjutere sa za to namenski instaliranih i do 16.000 čipova, inženjeri DeepSeek-a ističu da su isto to uspjeli da postignu sa samo oko 2.000 specijalizovanih Nvidia AI čipova.
Kako sve to radi?
U odnosu na radnije velike jezičke modele (LLM), DeepSeek-R1 za učenje koristi novu metodu koja ga čini dosta sposbnijim, posebno u rješavanju naučnih problema.
Kao i OpenAI o1, on je sposoban da samostalno "rasuđuje" prije nego što generiše odgovor na upit. Odgovor se generiše postepeno, u procesu koji analognom ljudskom razmišljanju, dok korisnik istovremeno, putem interfejsa aplikacije, može da posmatra kako četbot "razmišljanja".
DeepSeek-R1 se služi procesom poznatim kao "lanac razmišljanja", koji podrazumijeva vraćanje koraka unazad i procjenu prethodno urađenog, što mu omogućava automatsko unapređivanje sopstvenih sposobnosti za rješavanje složenijih zadataka.
A kako je riječ o modelu lako dostupnom stručnjacima, oni su u mogućnosti da proučavaju i testiraju njegov algoritam. Testiran na određenim zadacima iz hemije, matematike i programiranja, R1 je pokazao rezultate koji su u potpunosti na nivou OpenAI-jevog modela o1, predstavljenog u septembru prošle godine.
I šta ćemo sad...
DeepSeek je, za možda najkraće vrijeme ikada, uspeo da postane globalno vidljiv i prepoznatljiv i da se izjednači, pa čak i da nadmaši, vodeće AI modele američkih kompanija. Njegov trenutni uspjeh otvara pitanje da li se do sada razvoju veštačke inteligencije pristupalo na pravi način.
Osim postignutih rezultata, kineski četbot najviše prašine podigao je činjenicom da je do njih uspio da dođe za mnogo manje uloženog novca i mnogo manje specijalizovanog hardvera nego što je to kod neposredne američke konkurencije slučaj. Time je postavio ozbiljno pitanje isplativosti dosadašnjeg pristupa razvoju takvih AI sistema, na načine na koji je to do sada rađeno.
Njegovim stupanjem na scenu, u pitanje je, takođe, dovedena i sama globalna dominacija američkih tehnoloških kompanija, kakve su OpenAI i Nvidia, u sferi razvoja vještačke inteligencije, što bi možda, u bliskoj budućnosti, moglo da se odrazi i na njihove visoke vrijednosti.
Ponajbolji zaključak ove priče dao je tehnološki stručnjak iz Toronta Ruven Koen, koji kaže da DeepSeek-V3 koristi od kako se u decembru pojavio. U komentaru za New York Times, ističe da je V3 potpuno uporediv sa najnovijim AI sistemima OpenAI-ja, ali da je "mnogo jeftiniji za korišćenje": "DeepSeek je način da uštedim novac. To je vrsta tehnologije koju neko poput mene želi da koristi!"