Ķīnas tehnoloģiju uzņēmums Alibaba trešdien izlaida jaunu sava Qwen 2.5 mākslīgā intelekta modeļa versiju, kas, pēc tās domām, pārspēja augsti atzīto DeepSeek-V3.
Neparastais Qwen 2.5-Max izlaišanas laiks Mēness Jaunā gada pirmajā dienā, kad lielākā daļa ķīniešu ir ārpus darba un ar savām ģimenēm, norāda uz spiedienu, ko Ķīnas mākslīgā intelekta startapa DeepSeek meteoriskais pieaugums pēdējo trīs nedēļu laikā ir radījis ne tikai aizjūras konkurentu, bet arī vietējo konkurenci.
“Qwen 2.5-Max pārspēj … gandrīz visos parametros GPT-4o, DeepSeek-V3 un Llama-3.1-405B,” teikts Alibaba mākoņdatošanas vienības paziņojumā, kas publicēts tās oficiālajā WeChat kontā, atsaucoties uz OpenAI un Meta vismodernāko AI modeļu atvēršanu.
DeepSeek AI 10. janvāra izlaišana, ko darbina DeepSeek-V3 modelis, kā arī tā modeļa R1 izlaidums 20. janvārī ir šokējis Silīcija ieleju un izraisījis tehnoloģiju akciju lejupslīdi, jo Ķīnas jaunizveidotajam uzņēmumam šķietami zemā attīstība un lietošanas izmaksas, kas liek investoriem apšaubīt ASV vadošo AI firmu milzīgos izdevumu plānus.
Taču DeepSeek panākumi ir izraisījuši arī vietējo konkurentu sacelšanos, lai uzlabotu savus AI modeļus.
Divas dienas pēc DeepSeek-R1 izlaišanas TikTok īpašnieks ByteDance izlaida sava vadošā AI modeļa atjauninājumu, kas, pēc tā teiktā, pārspēja Microsoft atbalstīto OpenAI o1 AIME, etalonpārbaudē, kas mēra, cik labi AI modeļi saprot un reaģē uz sarežģītām instrukcijām.
Tas atkārtoja DeepSeek apgalvojumu, ka tā R1 modelis vairākos veiktspējas kritērijos konkurē ar OpenAI o1.
DeepSeek V3 modeļa priekštecis DeepSeek-V2 izraisīja AI modeļu cenu karu Ķīnā pēc tam, kad tas tika izlaists pagājušā gada maijā.
Fakts, ka DeepSeek-V2 bija atvērtā pirmkoda un nepieredzēti lēts, tikai 1 juaņa (0,14 USD) par 1 miljonu marķieru vai AI modeļa apstrādāto datu vienībām, noveda pie tā, ka Alibaba mākoņa vienība paziņoja par cenu samazināšanu līdz pat 97% no modeļu klāsta.
Citi Ķīnas tehnoloģiju uzņēmumi sekoja šim piemēram, tostarp Baidu, kas 2023. gada martā izlaida Ķīnas pirmo ChatGPT ekvivalentu, un valsts vērtīgāko interneta uzņēmumu Tencent.
Liangs Venfens, DeepSeek noslēpumainais dibinātājs, retā intervijā Ķīnas plašsaziņas līdzekļiem jūlijā sacīja, ka jaunuzņēmumam “nerūpēja” cenu kari un ka AGI (mākslīgā vispārējā intelekta) sasniegšana bija tā galvenais mērķis.
OpenAI definē AGI kā autonomas sistēmas, kas ekonomiski vērtīgāko uzdevumu veikšanā pārspēj cilvēkus.
Lai gan tādos lielos Ķīnas tehnoloģiju uzņēmumos kā Alibaba ir simtiem tūkstošu darbinieku, DeepSeek darbojas kā pētniecības laboratorija, kurā galvenokārt strādā jauni absolventi un doktoranti no labākajām Ķīnas universitātēm.
Liangs savā jūlija intervijā sacīja, ka, viņaprāt, Ķīnas lielākie tehnoloģiju uzņēmumi varētu nebūt piemēroti mākslīgā intelekta nozares nākotnei, pretstatā to augstām izmaksām un lejupejošām struktūrām ar DeepSeek taupīgo darbību un vaļīgo vadības stilu.
“Lielie pamata modeļi prasa nepārtrauktas inovācijas, bet tehnoloģiju gigantu iespējām ir savas robežas,” viņš teica.