Dok je svjetska pažnja usmjerena na moćne chatbotove poput ChatGPT-ja i Claudea, lako je previdjeti uspon drugog segmenta umjetne inteligencije – takozvanih modela svijeta (engl. world models). Ti sustavi, za razliku od današnjih chatbotova, mogu razumjeti trodimenzionalni prostor i zakone fizike, što je temelj za rad svega od robota i pametnih naočala do samovozećih automobila. U protekla dva tjedna, Nvidia Corp., Alibaba Group i Tencent Holdings Ltd. objavili su vlastite modele svijeta, signalizirajući da bi novi akteri mogli predvoditi sljedeću AI revoluciju. Tvrtke u prvom planu slijede različite komercijalne strategije, Tencentov HY-World 2.0 je otvorenog koda, dok je Nvidijin model namijenjen isključivo istraživačima. Kina ovaj put puno brže hvata korak nego u vrijeme uspona velikih jezičnih modela.
Botovi poput ChatGPT-ja možda ostavljaju dojam da razumiju funkcioniranje fizičkog svijeta, ali u stvarnosti su oni tek vješti imitatori bez ikakvog uporišta u materijalnom svijetu i bez postojanosti objekta (nečega što ljudi razvijaju još kao bebe – razumijevanju da objekti postoje čak i kada su izvan našeg vidnog polja). Jezični model može opisati sobu elegantnom prozom, ali ako ga pitate može li fotelja proći kroz vrata ili gdje će loptica završiti nakon što se odbije od zida, on će odgovor generirati na temelju tekstualnih obrazaca iz svoje baze, a ne na stvarnom poznavanju fizičkih sila, zbog čega često griješi. Modeli svijeta nastoje popuniti tu prazninu.
Ovaj pothvat tiho dobiva na zamahu zahvaljujući nizu pristupa i poslovnih modela koji koriste podatke iz stvarnog svijeta, uključujući i jednu viralnu igru koja je debitirala prije deset godina. Sjećate li se igre Pokémon Go, aplikacije zbog koje su milijuni ljudi kamerom od mobitela tražili Pokémone na ulicama? Ta je aplikacija u međuvremenu prikupila golemu globalnu riznicu geolokacijskih podataka koje sada dijeli s tvrtkama kao što su Coco Robotics, čiji roboti dostavljaju namirnice po gradovima SAD-a i Europe. Tvorac igre, Niantic Spatial, gradi tzv. Veliki geoprostorni model (LGM) čiji će krajnji korisnici zapravo biti roboti.
Čitaj više
Meta steže remen: 10 posto radne snage dobiva otkaz zbog AI strategije
Meta reže tisuće radnih mjesta kako bi financirala ambicioznu AI strategiju i očuvala profitabilnost u eri rastućih troškova.
24.04.2026
AI pranje: što stoji iza vala otkaza u IT sektoru
Meta ulaže 135 milijardi dolara u umjetnu inteligenciju, dok Amazon otpušta 16.000 ljudi unatoč rekordnim prihodima. Objašnjenje je isto: AI mijenja strukturu troškova. Ali sve više analitičara tvrdi da je to samo dio priče.
22.04.2026
Mythos ne predstavlja prijetnju samo bankama
Britanski Institut za sigurnost umjetne inteligencije utvrdio je da je Mythos sposobniji za izvođenje složenih kibernetičkih napada od drugih AI alata poput ChatGPT-ja ili Geminija.
15.04.2026
Je li “solo jednorog” budućnost ili još jedan VC mit?
Samo je pitanje vremena kada će nastati prva tvrtka vrijedna milijardu dolara sa samo jednim zaposlenikom.
20.04.2026
U međuvremenu, DoorDash plaća svojim radnicima da se snimaju dok slažu rublje ili peru posuđe kako bi prikupio podatke koje može prodati robotičkim tvrtkama za obuku sustava. Instacart je u suradnji s Nvidijom razvio kolica za kupovinu opremljena senzorima i kamerama, no ne za potrebe obučavanja robota, već radi prikupljanja podataka za oglašavanje i upravljanje zalihama.
Neki znanstvenici tvrde da je ovaj pristup umjetnoj inteligenciji ključan korak prema približavanju umjetne inteligencije ljudskoj, što je cilj koji OpenAI, Anthropic PBC i Google već godinama pokušavaju ostvariti. Google DeepMind, tvorac chatbota Gemini, također se kladi na modele svijeta svojim modelom Genie 3. Zamislite da ChatGPT, uz to što vlada jezikom, može sjesti za volan ili poslužiti vam kavu. To bi nas dovelo na korak do androida iz Asimovljeva djela Ja, robot ili nečega još apstraktnijeg, poput videoigara koje se prilagođavaju vašem stilu igre ili sustava industrijske automatizacije za plinske turbine.
Među tvrtkama koje iscrtavaju tu budućnost nalazi se i World Labs, startup koji je započeo kao projekt na Sveučilištu Stanford. Osnovala ga je Fei-Fei Li, koja se zbog svojeg rada na sustavima za automatsko prepoznavanje slika smatra jednom od pionira umjetne inteligencije. U veljači je njezina kompanija objavila da je u ranoj rundi financiranja prikupila milijardu dolara.
World Labs, sa sjedištem u San Franciscu, koristi svoj model pod nazivom Marble za generiranje vlastitih virtualnih svjetova s ciljem privlačenja klijenata iz industrije videoigara, virtualne stvarnosti i robotike. No, unatoč kapitalu investitora kao što su Nvidia, AMD i Autodesk, put do profita je još uvijek neizvjestan. "Wall Street, a posebno investitori u kasnijim fazama, još uvijek čekaju da tehnologija sazrije za konkretnu primjenu ", rekla mi je Li u nedavnom intervjuu. Unatoč tome, ona ne posustaje: "Čvrsto sam uvjerena da je ovo jednako korjenita promjena kao i pojava velikih jezičnih modela."
Li također vjeruje da će sintetički podaci biti presudni za modele svijeta jer, za razliku od jezika, na internetu ne postoji obilje 3D materijala. Drugim riječima, sljedeći val umjetne inteligencije mogao bi se uglavnom trenirati na snimkama koje je generirala druga umjetna inteligencija, a ne samo na videima radnika koji slažu odjeću. To bi samo po sebi moglo postati potencijalni poslovni model.
U današnjoj eri jezičnih modela pobjedu će vjerojatno odnijeti mala skupina bogatih američkih laboratorija sa zatvorenim modelima s ograničenim pristupom. Međutim, čini se da se modeli svijeta razvijaju drugačije – kroz širi spektar pristupa i regija, uz otvorenije licenciranje i bez jasnog konsenzusa o tome kako će se na njima zarađivati.
Kina bi ovdje mogla odigrati značajnu ulogu. Zahvaljujući svojoj prednosti u hardveru i proizvodnji, Kina je prošle godine isporučila oko 85 do 90 posto svih humanoidnih robota na svijetu, prema podacima istraživača iz Barclaysa. Ako kineski modeli svijeta postanu standard za obuku robota, tvrtke koje će oblikovati iduće desetljeće fizičke umjetne inteligencije neće biti one čija imena danas čitamo u naslovima, a mogle bi se nalaziti i jako daleko od Silicijske doline.