Brezplačna aplikacija klepetalnega robota DeepSeek je v ponedeljek v ZDA hitro postala najbolj priljubljena brezplačna aplikacija na Applovi trgovini App Store. Naval na to kitajsko stvaritev umetne inteligence je bil tako velik, da je klonilo spletišče podjetja, ki je moralo včeraj tudi zaradi kibernetskega napada začasno omejiti registracije.
Če so se zaradi DeepSeek včeraj izdatno znižale delnice Nvidie, ameriškega velikana na področju izdelave čipov za umetno inteligenco, so v torek temu trendu sledile delnice tehnoloških podjetij na Japonskem. Razlog za to so stroški, domnevno potrebni za razvoj tako zmogljivih jezikovnih modelov. ZDA namreč v razvoj umetne inteligence vlagajo milijarde ameriških dolarjev, kar opravičujejo z visokimi stroški, ki jih terja usposabljanje jezikovnih modelov, zaradi katerih je ogromna tudi poraba elektrike in vode. V podjetju DeepSeek pa so po lastnih besedah za usposabljanje oziroma učenje modela porabili manj kot 6 milijonov dolarjev (5,7 milijona evrov), pri čemer naj bi jim tako sposoben jezikovni model uspelo razviti s precej manj zmogljivimi čipi Nvidie, kot so tisti najnaprednejši, ki jih za svoje jezikovne modele uporablja denimo ameriški OpenAI. Okoli te njihove trditve sicer obstaja precej dvomov.
Rekordna enodnevna izguba
Ekipa
Maksimalna energetska neodvisnost s paketom Pametna samooskrba
Skratka, delnice Nvidie so včeraj padle za kar 17 odstotkov, s čimer je tehnološki velikan v enem dnevu izgubil kar 593 milijard dolarjev (568 milijard evrov) tržne vrednosti, kar je zanje rekordna enodnevna izguba. Vlagatelji so namreč zaradi kitajskega modela začeli dvomiti v ameriške trditve o domnevno visokih stroških, ki jih terja razvoj tako naprednih jezikovnih modelov, pa tudi v sam ameriški primat na tem področju. V torek so sledile delnice tehnoloških velikanov na Japonskem. Veliko izgubo beleži predvsem podjetje Advantest, ki izdeluje opremo za testiranje čipov in je eden večjih dobaviteljev Nvidie. Pretres so občutili tudi na Nizozemskem, kjer izdelujejo litografske naprave za izdelavo najzmogljivejših čipov. Bržkone bi se podobno zgodilo na borzah v Južni Koreji in na Tajvanu, a so te zaradi kitajskega novega leta trenutno zaprte.
Glede jezikovnega modela DeepSeek se je oglasil tudi Sam Altman, izvršni direktor OpenAI, ki razvija najbolj znan jezikovni model na svetu ChatGPT. Kitajski izdelek je označil za »impresiven model.« Dodal je, da sami »seveda razvijajo precej boljše modele, a da je poživljajoče imeti novo konkurenco.«
Oglasil se je tudi japonski minister za digitalizacijo Masaaki Taira, ki je dejal, da je pojav jezikovnega modela DeepSeek konvencionalno prepričanje, da so Kitajci na tem področju več let za ostalimi silami, obrnil na glavo. Potrdil je, da Japonska zdaj podrobneje proučuje navedbe, da naj bi bil kitajski jezikovni model precej bolj stroškovno učinkovit.
O zagonskem podjetju oziroma laboratoriju, ki stoji za razvojem jezikovnega modela DeepSeek, je sicer znanega precej malo. Leta 2023 ga je ustanovil Liang Venfeng, ki je tudi njegov večinski delničar.