OpenAI se priprema za lansiranje novog "agenta" umjetne inteligencije (AI) pod nazivom Operator, koji može koristiti računalo za izvršavanje radnji u ime osobe, poput pisanja računalnog koda ili čak rezervacije putovanja, izvijestio je nedavno Bloomberg.
Operator je dio šireg nastojanja razvijatelja AI-ja da stvore agente ili softverske sustave umjetne inteligencije sposobne za višestupanjske zadatke uz minimalni nadzor. Anthropic je predstavio sličnog agenta koji u stvarnom vremenu može pratiti rad korisnikovog računala i djelovati u njegovo ime. Microsoft, koji podržava OpenAI, nedavno je također lansirao niz agentskih alata dizajniranih za slanje e-pošte i upravljanje arhivama, kako navodi Bloomberg.
Prema izjavama više izvora, OpenAI radi na nekoliko istraživačkih projekata povezanih s agentima. Onaj koji je najbliži završetku može obavljati zadatke putem mrežnog preglednika, odnosno najvjerojatnije preko OpenAI platformi, i već je gotovo spreman za testiranje. O tome će možda govoriti i Sam Altman, koji je za kraj siječnja najavio nešto novo.
Programer pronašao dokaze da je gotovo spreman
Kyle Wiggers prenio je izvještaj Tibora Blahe, programera poznatog po otkrivanju novih informacija o razvoju različitih platformi. Ovoga puta Blaho tvrdi da je na pozadini stranice pronašao dokaze koji ukazuju na to da je Operator gotovo spreman.
ChatGPT za macOS dobio je skrivene mogućnosti, poput definiranja prečaca za aktivaciju ili deaktivaciju (engl. toggle Operator) te prisilnog zaustavljanja Operatora (engl. force quit Operator), izjavio je Blaho. OpenAI je također na svojoj stranici dodao reference za Operatora koje još nisu javno dostupne.
Skrivena tablica
Prema Blahu, stranica OpenAI-ja uključuje i nejavne tablice koje procjenjuju učinkovitost Operatora u usporedbi s drugim sustavima umjetne inteligencije dizajniranim za korištenje računala. Ako su podaci točni, pokazuju da Operator nije potpuno pouzdan, jer njegova uspješnost značajno varira ovisno o zadatku.
Na testu OSWorld, koji simulira stvarno računalno okruženje, OpenAI Computer Use Agent (CUA), vjerojatno AI model iza Operatora, postigao je 38,1 posto. To je bolje od modela Anthropic za upravljanje računalima, ali znatno slabije od 72,4 posto, koliko postižu ljudi. Ipak, OpenAI CUA na testu WebVoyager, koji ocjenjuje navigacijske sposobnosti umjetne inteligencije, nadmašuje ljudske rezultate. Međutim, na drugom internetskom testu, WebArena, zaostaje za ljudima, prenosi TechCrunch.
Ako su podaci točni, Operator također ne uspijeva u zadacima koje ljudi obično obavljaju bez poteškoća. Na testu u kojem je trebalo kreirati račun kod pružatelja usluga u oblaku i pokrenuti virtualni stroj, bio je uspješan samo u 60 posto slučajeva. Još lošije se pokazao u kreiranju bitcoin novčanika, gdje mu je uspješnost iznosila samo deset posto.