Ant Group, uz potporu Jacka Maa, koristila je poluvodiče kineske proizvodnje za razvoj tehnika obuke modela umjetne inteligencije koje bi mogle smanjiti troškove za 20 posto, prema ljudima upućenima u to pitanje.
Ant je koristio domaće čipove, uključujući one koje proizvode podružnice Alibaba Group Holding i Huawei Technologies, za treniranje modela, koristeći metodu strojnog učenja nazvanu "Mješavina stručnjaka", rekli su izvori. Rezultati su, rekli su, usporedivi s onima koje proizvode Nvidijini čipovi poput H800. Osobe koje su to otkrile željele su ostati anonimne jer informacija još nije javna.
Ant sa sjedištem u Hangzhouu i dalje koristi Nvidijine čipove za razvoj umjetne inteligencije, ali za svoje najnovije modele uglavnom se oslanja na alternative, uključujući čipove tvrtke Advanced Micro Devices i kineske poluvodiče, rekao je jedan od izvora.
Čitaj više

Alibaba surfa val kineske AI burzovne euforije
Tehnološki indeks Hang Seng u Hong Kongu dosegao je višegodišnji vrhunac.
06.03.2025

OpenAI testira novi GPT-4.5 koji bi trebao biti bolji u pisanju i programiranju
Nova verzija AI modela u početku će biti dostupna samo odabranim korisnicima koji već plaćaju 200 dolara mjesečno za pretplatu na ChatGPT Pro.
28.02.2025

Što koči razvoj AI-ja u Europi? Pitali smo stručnjakinju iz Amazona
Europske zemlje već godinama trpe kritike zbog svoje produktivnosti i često se uspoređuju sa Sjedinjenim Američkim Državama, koje su u tom pogledu daleko ispred.
25.02.2025

CES 2025: Nvidia otkriva ambicioznu viziju novog svijeta
Tvrtka je predstavila svoje prvo računalo, nove grafičke procesore i suradnju s Toyotom.
07.01.2025
Ovi modeli predstavljaju Antov ulazak u sve konkurentniju utrku između kineskih i američkih kompanija, koja se ubrzala nakon što je DeepSeek pokazao da se sposobni modeli mogu trenirati za znatno manje novca od milijardi koje su uložili OpenAI i Alphabetov Google. Ovo naglašava napore kineskih tvrtki da koriste domaće alternative Nvidijinim najnaprednijim čipovima. Iako H800 nije najjači čip, ipak je relativno moćan procesor kojeg SAD trenutno zabranjuje izvoziti u Kinu.
Traženje alternativa
Tvrtka je ovog mjeseca objavila istraživački rad u kojem tvrdi da su njeni modeli bolji od Metinih u određenim testovima, što Bloomberg News nije mogao neovisno potvrditi. No, budu li modeli doista radili kako tvrtka tvrdi, Antove platforme mogle bi predstavljati novi korak naprijed za razvoj umjetne inteligencije u Kini, jer bi značajno smanjile troškove zaključivanja ili rada AI servisa.
Kako tvrtke mnogo ulažu u razvoj umjetne inteligencije, modeli Mixture of Experts (MoE) postali su popularan izbor. Dobili su priznanje za svoju upotrebu od strane tvrtki kao što su Google i startup DeepSeek sa sjedištem u Hangzhouu. Ova tehnika dijeli zadatke u manje skupove podataka – slično timu stručnjaka, od kojih svaki ima svoj dio zadatka - i time povećava učinkovitost procesa. Ant ne želi komentirati.
MoE modeli za obuku obično se temelje na snažnim čipovima, kao što su grafički procesori koje prodaje Nvidia. Troškovi su do sada bili previsoki za mnoge manje tvrtke, što je ograničavalo širu upotrebu ove tehnologije. Ant pokušava prevladati ovu prepreku razvijanjem učinkovitijih pristupa obučavanju velikih jezičnih modela (LLM). To je jasno naznačeno naslovom njihovog istraživačkog rada, u kojem tvrtka ističe cilj skaliranja modela "bez vrhunskih grafičkih procesora".
To je u suprotnosti s Nvidijinom filozofijom. Izvršni direktor Jensen Huang inzistira na tome da će potražnja za računalnom snagom nastaviti rasti čak i kada se budu razvijali učinkovitiji modeli poput DeepSeekova R1. Prema njegovim riječima, tvrtkama će trebati snažniji čipovi kako bi ostvarile više prihoda - a ne jeftinija rješenja za smanjenje troškova. Nvidia se stoga nastavlja fokusirati na strategiju izgradnje velikih grafičkih procesora s više procesorskih jezgri, više tranzistora i većim kapacitetom memorije.
Što kaže Bloomberg Intelligence
"Istraživanje Ant Groupa baca svjetlo na rastuću inovaciju i ubrzani tehnološki napredak u području umjetne inteligencije u Kini. Potvrde li se tvrdnje tvrtke, to bi značilo da je Kina na dobrom putu prema tehnološkoj samodostatnosti na polju AI - prvenstveno razvojem cjenovno pristupačnijih i računalno učinkovitijih modela, s kojima pokušava zaobići američka ograničenja izvoza Nvidijinih čipova", kaže Robert Lea, viši analitičar Bloomberg Intelligencea.
Ant je rekao da obuka jednog trilijuna tokena s hardverom visokih performansi košta oko 6,35 milijuna juana (880 000 dolara), dok bi optimizirani pristup i manje moćan hardver smanjio trošak na 5,1 milijun juana. Tokeni su jedinice informacija koje model "probavlja" kako bi naučio razumjeti svijet i pružiti smislene odgovore na pitanja korisnika.
Tvrtka planira primijeniti najnovija dostignuća u razvoju svojih velikih jezičnih modela – Ling-Plus i Ling-Lite – na industrijska rješenja umjetne inteligencije, uključujući zdravstvo i financije, kažu izvori. Ant je ove godine kupio kinesku online platformu Haodf.com kako bi ojačao svoje AI usluge u zdravstvu. U zasebnom priopćenju za javnost u ponedjeljak, tvrtka je objasnila da je razvila pomoćnika umjetne inteligencije, nazvanog AI Doctor Assistant, koji podržava 290.000 liječnika na Haodf platformi sa zadacima kao što je upravljanje medicinskom dokumentacijom.
Bloomberg
Tvrtka također ima aplikaciju za svakodnevni život potpomognutu umjetnom inteligencijom pod nazivom Zhixiaobao i uslugu financijskog savjetovanja utemeljenu na umjetnoj inteligenciji, Maxiaocai. U istraživačkom radu, Ant je napisao da je model Ling-Lite imao bolje rezultate u ključnim mjerama razumijevanja engleskog jezika od jednog od Meta-inih modela Llama. I Ling-Lite i Ling-Plus nadmašili su modele DeepSeeka u testovima razumijevanja kineskog jezika.
"Ako nađete jednu točku napada koja porazi najboljeg majstora kung fua na svijetu, još uvijek možete reći da ste ga pobijedili – stoga je primjena u stvarnom svijetu ključna", rekao je Robin Yu, tehnički direktor pekinškog pružatelja AI rješenja Shengshang Tech.
Nova medicinska sredstva
Ant je objavio modele Ling kao otvoreni kod. Model Ling-Lite ima 16,8 milijardi parametara – oni djeluju kao postavke koje usmjeravaju ponašanje modela. Ling-Plus ima čak 290 milijardi parametara, što se u svijetu jezičnih modela smatra relativno velikim modelom. Za usporedbu: Stručnjaci procjenjuju da GPT-4.5, koji pokreće ChatGPT, ima oko 1,8 trilijuna parametara, dok DeepSeek-R1 ima 671 milijardu, prema MIT Technology Review. Tvrtka je u anketi primijetila da se suočila s izazovima tijekom obuke, posebno sa stabilnošću. Čak su i manje promjene u hardveru ili strukturi modela uzrokovale probleme - na primjer, skokove u stopama pogrešaka modela.
Ant je u ponedjeljak objavio da je razvio opsežne jezične modele usmjerene na zdravstvenu skrb koje sada koriste bolnice i pružatelji zdravstvenih usluga u sedam gradova, uključujući Peking i Šangaj. Model kombinira DeepSeek R1, Alibabin Qwen i Antov vlastiti LLM te je sposoban pružiti zdravstveno savjetovanje.
Tvrtka je također predstavila dva medicinska AI agenta: Angel, koji se već koristi u više od 1000 zdravstvenih ustanova, i Yibaoer, koji podržava usluge zdravstvenog osiguranja. Prošlog rujna Ant je lansirao uslugu AI Healthcare Manager unutar aplikacije za plaćanje Alipay.