OpenAI predstavlja ChatGPT agenta – AI pomočnika, ki lahko načrtuje, nakupuje in pripravlja PowerPoint predstavitve namesto vas

ChatGPT se razvija iz klepetalnega robota v osebnega asistenta
OpenAI je predstavil veliko nadgradnjo ChatGPT, s katero je priljubljeni klepetalni robot postal osebni AI asistent, ki ni sposoben le odgovarjati na vprašanja, temveč tudi ukrepati v imenu uporabnika. Nova funkcija, imenovana ChatGPT “Agent”, je bila predstavljena v četrtek in omogoča ChatGPT, da “razmišlja” in deluje s pomočjo lastnega virtualnega računalnika theguardian.com. V praksi lahko uporabniki zdaj prosijo ChatGPT, da opravi večstopenjske naloge – od iskanja rezervacij v restavracijah ali spletnega nakupovanja do samostojnega ustvarjanja celotnih preglednic in predstavitev theguardian.com. OpenAI pravi, da ta način agenta omogoča AI, da brska po spletnih straneh, upravlja spletne brskalnike in aplikacije, upravlja datoteke in ustvarja izhode, kot so Excelove datoteke ali PowerPoint predstavitve, namesto da bi le izpisoval besedilne odgovoretechmeme.com.
Zakaj je to pomembno: Nadgradnja je najdrznejši korak OpenAI doslej, da preseže statični Q&A klepetalni robot in ustvari AI, ki deluje kot digitalni asistent ali “agent”. Za razliko od običajnih klepetalnih robotov lahko AI agenti izvajajo zapletene, večstopenjske poteke dela z interakcijo s programsko opremo in spletnimi stranmi v imenu uporabnika theverge.com. “Upamo, da bodo agenti uporabnikom prinesli resnično uporabnost – da bodo dejansko kaj naredili namesto njih in ne le izpisovali izpiljeno besedilo in zveneli impresivno,” pravi Niamh Burns, višja medijska analitičarka pri Enders Analysis theguardian.com. V bistvu je novi način agenta ChatGPT namenjen izpolnitvi te obljube s tem, da za uporabnike opravlja resnično spletno delo, ne le klepeta.
OpenAI-jev ChatGPT Agent uporablja vgrajen “virtualni računalnik” za brskanje po spletu, izpolnjevanje obrazcev, izvajanje kode in celo ustvarjanje Excelovih preglednic ali PowerPoint predstavitev v imenu uporabnika openai.comtechmeme.com.
Kaj zmore novi ChatGPT Agent?
OpenAI opisuje ChatGPT Agenta kot digitalnega pomočnika splošnega namena, ki lahko opravlja široko paleto računalniško podprtih nalog techcrunch.com. Nekateri primeri, kaj lahko stori, vključujejo:
- Upravljanje urnikov in načrtov: Preveri vaš koledar in vas obvesti o prihajajočih sestankih ali poišče večer, ko ste prosti, ter nato poišče rezervacije v restavracijah prek OpenTable openai.com theverge.com. Lahko načrtuje dogodke, kot je zmenek, tako da primerja vaš urnik z razpoložljivostjo v restavracijah.
- Spletne raziskave in poročila: Izvede poglobljeno spletno raziskavo o določeni temi in pripravi jedrnato poročilo ali analizo. Na primer, lahko analizira trende (npr. »vzpon Beanie Babies proti Labubus«) in ustvari povzetek ali podrobno raziskovalno nalogo theverge.com.
- Nakupovanje in naročila: Agent lahko opravi spletno nakupovanje namesto vas. Lahko ga prosite, da poišče izdelke z določenimi kriteriji, primerja možnosti in celo odda naročila (z vašim dovoljenjem) theguardian.com wired.com. Vodja raziskav pri OpenAI, Isa Fulford, je agentu celo naročila, naj po njenih navodilih naroči serijo kolačkov – naloga, ki je »trajala skoraj eno uro«, a je bila zanjo vseeno lažja kot če bi jo opravila ročno wired.com.
- Pisarna opravila – preglednice in predstavitve: Morda najbolj opazno je, da lahko ChatGPT Agent ustvari ureljive datoteke. Na podlagi vašega poziva lahko ustvari Excelovo preglednico ali PowerPointovo predstavitev iz nič openai.com. Na primer, lahko ga prosite, da analizira podatke o vaših konkurentih in ustvari predstavitev z grafikoni, ki povzemajo ugotovitve openai.com. Prav tako lahko posodobi preglednice z novimi podatki ali pretvori niz posnetkov zaslona v oblikovano predstavitev openai.com. Izhodne datoteke so na voljo za prenos in namenjene odpiranju v standardni pisarniški programski opremi (čeprav OpenAI opozarja, da je funkcija ustvarjanja predstavitev še vedno v beta fazi) openai.com.
- Uporaba orodij za razvijalce in API-jev: V ozadju ima agent dostop do programskega terminala in lahko kliče javne API-je. To pomeni, da lahko zažene kodo za izvajanje prilagojenih izračunov ali poizveduje zunanje storitve. Lahko se poveže z aplikacijami, kot sta Gmail ali GitHub, prek “konektorjev” in pridobi informacije (z dovoljenjem uporabnika), ki jih uporabi v svojih odgovorih openai.com. OpenAI pravi, da lahko ChatGPT Agent celo izpolnjuje spletne obrazce in komunicira s storitvami, kot sta Google Drive ali SharePoint, z uporabo API klicev wired.com.
Vse te zmožnosti so usklajene tako, da ima AI svoj lasten “virtualni brskalnik/računalnik”, v katerem deluje. Ko mu dodelite nalogo, bo ChatGPT brskal po spletnih straneh, kliknil povezave ali gumbe, se pomikal po straneh, izpolnjeval besedilna polja, pisal in izvajal kodo itd. – karkoli je potrebno za dokončanje naloge openai.comtechmeme.com. Deluje postopoma in samostojno, sam odloča, katero orodje ali spletno stran bo uporabil naslednje. Na primer, načrtovanje japonske večerje lahko vključuje iskanje receptov na Googlu, nato odpiranje spletne trgovine za naročilo sestavin in na koncu ustvarjanje preglednice z nakupovalnim seznamom – vse to opravi agent brez potrebe po natančnem usmerjanju uporabnika pri vsakem koraku.
Kako deluje ChatGPT Agent?
V zakulisju ChatGPT Agent poganja nov AI model, ki ga je OpenAI posebej razvil za agentske naloge, ločeno od osnovnega modela GPT-4 theverge.com. Model je bil izurjen z okrepljenim učenjem za obvladovanje zapletenih nalog, ki zahtevajo uporabo več orodij (kot so brskalniki, API-ji in koda) v zaporedju theverge.com. Pravzaprav je OpenAI združil dva prejšnja eksperimentalna sistema – Operator (orodje za brskanje/avtomatizacijo) in Deep Research (orodje za poglobljeno analizo) – v tega enotnega agenta. “Ugotovili smo, da sta izdelka zelo komplementarna, zato smo se odločili združiti ekipe,” pravi Fulford wired.com. Rezultat je agent, ki združuje Operatorjevo sposobnost klikanja po spletu s spretnostjo Deep Research pri sintezi informacij v enem delovnem toku wired.com.
Zbirka veščin: ChatGPT Agent je opremljen z več specializiranimi orodji, ki jih lahko uporablja openai.com:
- Vizualni brskalnik za interakcijo s spletnimi stranmi prek običajnega grafičnega vmesnika, kot bi to počel človek (klikanje gumbov, navigacija po straneh).
- Besedilni brskalnik za hitro pošiljanje HTTP zahtevkov in razčlenjevanje surovega besedila (uporabno za hitrejše branje obsežnih besedil ali kadar vizualni prikaz ni potreben) openai.com.
- Terminal/Konzola, ki mu omogoča izvajanje kode, upravljanje datotek ali uporabo ukaznih orodij znotraj svojega peskovniškega okolja openai.com.
- Neposreden dostop do API-jev, kar mu omogoča klicanje API-jev zunanjih storitev (npr. objavljanje v Google Koledarju, poizvedovanje po bazi podatkov ali pridobivanje podatkov iz spletne storitve) openai.com.
- Povezovalniki z uporabniškimi računi: Uporabniki lahko povežejo svoje lastne aplikacije (kot so e-pošta ali GitHub). S dovoljenjem lahko agent pridobi ustrezne informacije iz vaših e-poštnih sporočil, koledarja ali drugih računov za izvedbo nalog openai.com. Na primer, lahko pregleda vaš Gmail za nedavna sporočila, če je to potrebno za pripravo povzetka, ali pa preko API-ja preveri vaš koledar, da najde proste termine.
Ta orodja omogočajo AI, da izbere optimalen pristop za nalogo. Lahko uporabi API za hitro preverjanje vaše razpoložljivosti v koledarju, nato pa preklopi na vizualni brskalnik za navigacijo po strani za rezervacije OpenTable, ki zahteva klikanje in človeško interakcijo openai.com. Lahko prenese datoteko preko besedilnega brskalnika ali API-ja, zažene kodo na njej v terminalu za analizo ali preoblikovanje, nato pa odpre rezultate v vizualnem brskalniku, da vam jih predstavi openai.com. Vse to se dogaja znotraj agentovega virtualnega stroja, ločenega od vaše dejanske naprave – tako je, kot da ima AI svoj računalnik, kjer izvaja vaša navodila openai.com.
Uporabniška izkušnja: Za končnega uporabnika je uporaba ChatGPT Agenta enostavna. Funkcija je na voljo preko novega “Agent mode” v ChatGPT vmesniku za tiste, ki imajo dostop openai.com. Preprosto začnete poziv z nalogo (lahko tudi vtipkate ukaz s poševnico “/agent”) in AI prevzame pobudo theverge.com. Med delom se na zaslonu prikazuje pripoved, kaj agent počne korak za korakom – na primer, “Brskanje do maps.google.com… Iskanje ‘italijanske restavracije v bližini’…” – tako lahko spremljate postopek openai.com openai.com. Pomembno je, da lahko prekinete ali usmerjate agenta kadarkoli: lahko ustavite postopek, da pojasnite svoja navodila ali ga prosite, naj ubrne drugo pot, in se bo prilagodil sredi naloge brez izgube napredka openai.com. Ta sodelovalna zanka je namenjena temu, da AI ostane usklajen z vašimi cilji.
Varnostne funkcije: Nadzor nad dejanji AI
Opolnomočenje umetne inteligence za izvajanje dejanj na spletu odpira očitne varnostne pomisleke, kar OpenAI priznava, saj ta nov način prinaša “več tveganj kot prejšnji modeli” theguardian.com. Da bi to omilili, je OpenAI uvedel niz varoval in omejitev:
- Dovoljenje uporabnika za občutljiva dejanja: “Vedno imate nadzor,” poudarja OpenAI theguardian.com. ChatGPT Agent bo zahteval izrecno potrditev preden izvede karkoli z resnimi posledicami, kot je nakup, pošiljanje e-pošte ali rezervacija v vašem imenu theguardian.com theverge.com. Uporabnik mora odobriti te nepovratne korake, kar preprečuje, da bi AI, na primer, impulzivno naročil za 1.000 $ naprav na Amazonu brez vašega vedenja.
- Omejitve za “visoko tvegano” vsebino (bio/kemično): Glede na izboljšane zmožnosti agenta ga je OpenAI uvrstil v kategorijo “visoko biološko in kemično tveganje”, čeprav imajo “nobenih dokončnih dokazov”, da bi lahko pomagal ustvariti biološko orožje theguardian.com theverge.com. Ta previdnostni ukrep (del OpenAI-jevega okvira za pripravljenost) pomeni, da so dodatne varovalke aktivne. Konkretno, OpenAI izvaja sprotni klasifikator vsebine na vsakem agentovem pozivu, da preveri, ali je povezan z biologijo ali kemijo, in če je, agentov odgovor preveri še drugi varnostni model, da zagotovi, da ne daje nevarnih navodil techcrunch.com techcrunch.com. Z drugimi besedami, če bi nekdo poskušal zlorabiti agenta, da bi, na primer, pripravil strupeno snov, je sistem zasnovan tako, da to zazna in blokira.
- Usposobljen za zavračanje škodljivih nalog: Agent je bil usposobljen, da zavrne določene sumljive ali zlonamerne zahteve. Na primer, zavrne, če ga pozovete, naj izvede nekaj očitno nevarnega ali neetičnega, kot je izvedba bančnega nakazila na neznan račun ali izvajanje destruktivnih ukazov theguardian.com. OpenAI pravi, da so rdeči timi in strokovnjaki s področja pomagali testirati sistem v “realističnih scenarijih” za utrditev teh zavrnitev openai.com.
- Onemogočen dolgoročni spomin: Ena zanimiva omejitev – ChatGPT-jev dolgoročni spomin na pogovor je v načinu agenta izklopljen techcrunch.com. Običajno si ChatGPT lahko zapomni informacije iz prejšnjih pogovorov ali sej (če je omogočeno), vendar je OpenAI zaskrbelo, da bi lahko iznajdljiv napadalec to izkoristil med agentovimi nalogami (prek tako imenovanih prompt injections), da bi agent razkril občutljive podatke ali naredil nezaželene stvari techcrunch.com. Posledično agent trenutno deluje brez stanja, brez prenosa informacij iz prejšnjih pogovorov. OpenAI lahko v prihodnosti ponovno omogoči spomin, ko bodo prepričani, da je varno, a za zdaj ta “dodatni previdnostni ukrep” preprečuje morebitno uhajanje podatkov wired.com.
- Finančne transakcije niso dovoljene: OpenAI je prav tako omejil finančne operacije za zdaj. Agent na primer ne bo izvedel denarnih nakazil ali borznih poslov, tudi če ga uporabnik to prosi theverge.com. Pravzaprav obstaja varovalo, imenovano “Watch Mode”, ki se vklopi, če agent brska po določenih občutljivih spletnih straneh (kot so banke ali borzne platforme) – svojo dejavnost bo začasno ustavil, če uporabnik zapusti zavihek agentovega brskalnika, da prepreči kakršnekoli prikrite poteze v ozadju theverge.com.
- Obsežno testiranje in program nagrad za ranljivosti: OpenAI poudarja, da ima ta model njihov »najbolj celovit varnostni sklop doslej« glede modeliranja in spremljanja groženj openai.com openai.com. Sodelovali so z zunanjimi strokovnjaki za bio-varnost in so pred lansiranjem vključili domenske strokovnjake, da so red-team testirali agenta openai.com. Ob izidu je OpenAI objavil tudi podrobno sistemsko kartico, ki pojasnjuje tveganja, ter ponuja nagrado za napake, da bi spodbudili zunanje raziskovalce k poročanju o ranljivostih openai.com openai.com.
Kljub tem previdnostnim ukrepom se OpenAI zaveda, da se lahko pri delovanju umetne inteligence v divjem internetu še vedno pojavijo nepričakovana vedenja. Podjetje pravi, da bo postopoma izpopolnjevalo agenta in po potrebi prilagajalo varnostne ukrepe. Zaenkrat uporabnikom svetujejo, naj nadzorujejo dejanja agenta (tudi vmesnik to spodbuja z opisovanjem vsakega koraka). »Pri tem modelu obstaja več tveganj kot pri prejšnjih modelih,« priznava OpenAI, zato »ravnajo previdno in že zdaj uvajajo potrebne varnostne ukrepe« theguardian.com theguardian.com.
Zgodnje omejitve: hitrost in zanesljivost
Svojega človeškega asistenta še ne odpustite. V zgodnjih predstavitvah in testiranjih je ChatGPT Agent pokazal impresivne zmožnosti, a tudi opazne omejitve:
- Počasi in vztrajno: Agent pogosto potrebuje nekaj časa, da dokonča naloge. Lahko preživi več minut s klikanjem in brskanjem za zbiranjem informacij, kar traja precej dlje kot neposreden odgovor klepetalnega robota. V eni predstavitvi je agentu iskanje po Google Koledarju in spletnih straneh restavracij za predloge večerje vzelo približno 10–15 minut theguardian.com. Ustvarjanje kompleksne predstavitve ali obsežno raziskovanje lahko traja še dlje (osebje OpenAI je navedlo, da je naloga s prosojnicami v testiranju trajala približno 25 minut) wired.com. »Tudi če traja 15 minut, pol ure, je to precejšnje pospeševanje v primerjavi s tem, koliko časa bi za to potrebovali sami,« trdi Fulford in poudarja, da lahko uporabniki sprožijo nalogo in nato počnejo druge stvari, medtem ko agent dela theverge.com. Kljub temu je potrebna potrpežljivost; agent ni takojšen. Yash Kumar iz OpenAI ocenjuje, da povprečna naloga traja približno 10–15 minut v trenutni različici wired.com.
- Občasne težave: Tako kot vsak AI lahko tudi agent naredi napake ali se »zatakne« pri nalogi. Prvi uporabniki so poročali o mešanih rezultatih. Nekateri zapleteni poteki dela ga lahko zmedejo ali pa napačno razume navodilo na polovici naloge. Eden izmed prvih preizkuševalcev je komentiral, da je agent »spodletel pri vseh treh nalogah, ki sem mu jih dal… Lep vpogled v prihodnost, a trenutno še ni zares uporaben.«techmeme.com. To poudarja, da tehnologija, čeprav napredna, ni nezmotljiva. Tudi OpenAI sam poudarja, da je agent »še v zgodnji fazi« in da »še vedno lahko dela napake.« openai.com Pričakuje se, da bodo prihodnje posodobitve izboljšale njegovo zanesljivost in razumevanje.
- Osnovna kakovost izhoda: Funkcija za generiranje PowerPoint predstavitev/diapozitivov je trenutno v beta različici, kar pomeni, da so lahko ustvarjeni diapozitivi precej preprosti ali pa potrebujejo dodatno dodelavo openai.com. OpenAI se je najprej osredotočil na pravilno vsebino in strukturo, ne pa na bleščeč dizajn. Opozarjajo, da je lahko oblikovanje osnovno in da včasih prihaja do neskladij med predogledom diapozitiva in izvoženo PowerPoint datoteko openai.com. Podobno lahko agent ureja preglednice in ohranja formule, vendar še ni na ravni izkušenega uporabnika Excela. OpenAI že usposablja naslednjo različico, ki bo ustvarjala bolj “dodelane, sofisticirane izhode” v predstavitvah openai.com.
- Brez evropske predstavitve (zaenkrat): Omeniti velja, da ChatGPT Agent ni bil predstavljen v EU. OpenAI “še vedno dela na omogočanju dostopa za Evropski gospodarski prostor in Švico” openai.com. Uporabniki drugod (vključno z ZDA in Združenim kraljestvom) so takoj dobili dostop, evropski uporabniki pa morajo čakati nedoločen čas. OpenAI ni podal trdnega časovnega okvira za uvedbo v EU theverge.com. To je verjetno povezano z regulativnimi vprašanji – stroga pravila EU glede podatkov in umetne inteligence lahko zahtevajo dodatne korake za skladnost, preden OpenAI omogoči uporabo avtonomnega agenta. Za zdaj Evropejci vidijo le sporočilo, da funkcija v njihovi regiji ni na voljo.
Dostopnost: Kdo lahko uporablja ChatGPT agenta?
OpenAI najprej uvaja ChatGPT agenta kot ugodnost za plačljive naročnike. Od tega tedna je funkcija omogočena uporabnikom na paketih ChatGPT Pro, Plus in Team (približno enakovredno premijskim stopnjam) techcrunch.com. Pro uporabniki naj bi dostop dobili prvi (na dan lansiranja), sledili pa naj bi jim naročniki Plus in Team v naslednjih dneh openai.com. Stranke z načrti Enterprise in Education bodo dostop dobile “v naslednjih tednih”, ko bodo odpravljene začetne težave openai.com theverge.com. Za brezplačne uporabnike ni napovedanega časovnega okvira za prejem agent funkcionalnosti – in možno je, da bo to ostala plačljiva funkcija še nekaj časa, glede na dodano vrednost in visoke stroške računalniške obdelave.
Skupaj z večnivojskim dostopom je OpenAI uvedel mesečne omejitve uporabe. Naročniki Pro (najvišji nivo) lahko izvedejo do 400 agentskih nalog na mesec, medtem ko imajo uporabniki Plus in Team vključenih 40 nalog na mesec wired.com wired.com. Ta omejitev zagotavlja, da drage operacije ne uidejo izpod nadzora, vendar je lahko dodatna uporaba na voljo za nakup prek sistema kreditov, če uporabniki potrebujejo več openai.com. Naloge se štejejo na “agentski poziv”, kar pomeni, da vsakič, ko aktivirate agenta za neko opravilo, to šteje kot ena naloga.
Kot omenjeno, evropski uporabniki ob zagonu ne morejo dostopati do ChatGPT Agenta theguardian.com. Ko uporabniki zunaj EU vklopijo agentski način, so opozorjeni na eksperimentalno naravo funkcije in lahko nadaljujejo. Uporabniki iz EU pa so preprosto blokirani. OpenAI-jeva opomba, da delajo na dostopu za EGP, nakazuje, da je zadržek verjetno povezan z usklajevanjem z evropskimi predpisi (morda glede zasebnosti in Akta o umetni inteligenci). Takšen geografsko omejen zagon spominja na nekatere prejšnje funkcije ChatGPT (kot je brskanje po spletu), ki so bile začasno onemogočene v določenih regijah zaradi pravne negotovosti. Zaenkrat bodo morali vsi v EU počakati, dokler OpenAI ne zagotovi, da agent izpolnjuje lokalne zahteve.
Tekma za AI agente – Google, Anthropic & drugi
OpenAI-jev prodor v “agentsko” umetno inteligenco prihaja v času širšega trenda v industriji k avtonomnim AI asistentom. Pravzaprav so konkurenti že pripravljali svoje lastne agentske funkcije:
- Anthropicov Claude: Lani je Anthropic (ustvarjalec klepetalnika Claude) predstavil zmožnost, imenovano “Computer Use” – v bistvu je Claude dobil sposobnost uporabljati računalnik kot človek, na primer brskati po spletnih straneh in opravljati naloge na uporabnikovem računalniku theverge.com. Pred samo dvema mesecema (maj 2025) je Anthropic lansiral svoj najnovejši model Claude 2 (kodno ime Opus 4) z agentskimi funkcijami in prav tako aktiviral posebne biološke varnostne ukrepe za preprečevanje zlorab theverge.com. To kaže, da se tudi manjši AI startupi zavedajo tako moči kot tveganj avtonomnih agentov.
- Googlovi AI podaljški: Google si prizadeva za integracijo svojega generativnega AI (kot sta Bard in Assistant) z neposrednimi dejanji. Predstavili so AI, ki lahko sestavlja e-pošto v Gmailu, povzema dokumente v Google Drive in celo nadzira brskalnik prek njihovega eksperimentalnega “Duet AI” za Workspace. The Guardian navaja, da je Google pred kratkim lansiral podobne asistentske “agente”, ki lahko preklapljajo med aplikacijami za izpolnjevanje uporabniških nalog theguardian.com. Poleg tega je Google prejšnji teden zaposlil ključne člane ekipe iz startupa (Windsurf) prav z namenom okrepitve svojih agentnih AI projektov theverge.com, kar poudarja konkurenčno tekmo za razvoj asistentov v slogu Jarvisa.
- Drugi igralci: Tudi Meta (Facebook) in Amazon sta na predstavitvah rezultatov omenila ambicije AI agentov, kar kaže, da vsi v velikih tehnoloških podjetjih to vidijo kot naslednjo veliko stvar theverge.com. Na primer, podjetja za e-trgovino si predstavljajo AI agente, ki lahko v celoti obravnavajo klepete za podporo strankam ali nakupovalne zahteve. V izstopajočem zgodnjem primeru je fintech podjetje Klarna v začetku leta 2024 poročalo, da je njihov AI agent za podporo strankam obravnaval dve tretjini vseh klepetov s strankami, kar je enakovredno delu približno 700 ljudi theverge.com. Ta uspešna zgodba je pripomogla k popularizaciji izraza “AI agent” v poslovnih krogih, od takrat pa številni izvršni direktorji izpostavljajo AI na osnovi agentov kot cilj theverge.com.
- Pretekli poskusi: Tudi OpenAI se je že prej preizkusil z agenti. Januarja 2025 je izdal Operator kot raziskovalni predogled, opisan kot »agent, ki lahko gre na splet in opravlja naloge namesto vas« theverge.com. Operator je lahko klikal in se pomikal po spletnih straneh. Obstajal je tudi način Deep Research, ki je lahko pisal poglobljene analize. Ti predhodniki pa so bili omejeni po obsegu in včasih nestabilni. Tudi drugi startupi (kot je Adept AI s svojim ACT-1) so pokazali agente, ki lahko izvajajo ukaze v programski opremi kot človek, vendar še nobeden ni postal glavni izdelek. Zgodnje generacije AI agentov so se spopadale s kompleksnimi nalogami in zanesljivostjo techcrunch.com – pogosto so potrebovali veliko usmerjanja. Tehnološki direktorji so slikali vizije AI asistentov, ki bi lahko naredili vse, a resničnost je zaostajala za navdušenjem techcrunch.com.
Zdaj z agentom ChatGPT OpenAI poskuša preskočiti te prejšnje poskuse. Z združevanjem prednosti (brskanje po spletu + analiza) in uporabo inteligence na ravni GPT-4 trdijo, da imajo agenta, ki se končno približuje veliki viziji. »To je najboljša uporabniška izkušnja za agenta doslej. POPOLNOMA NORO. PREMAGAJTE TO!!« je po lansiranju objavil navdušen uporabniktechmeme.com. Čeprav je to mnenje očitno pretirano, zajema navdušenje v nekaterih delih AI skupnosti, da se približujemo »J.A.R.V.I.S.« – izmišljenemu AI butlerju Iron Mana – v resničnem življenju theverge.com. Za zdaj sta ChatGPT Agent in njegovi konkurenti še vedno zgodnji koraki proti temu idealu, večinoma obvladujejo raziskave, programiranje in osnovna spletna opravila, ne pa resnično odprte avtonomije theverge.com. A tekmovalni zagon je očiten: vsako AI podjetje želi biti prvo, ki bo razvilo AI asistenta, ki ga bodo ljudje dejansko uporabljali vsak dan.
Monetizacija: Bodo agenti prinašali denar za OpenAI?
Z lansiranjem ChatGPT Agenta OpenAI ne prikazuje le nove tehnologije – temveč meri tudi na potencialne prihodke. Podjetje je močno subvencioniralo razvoj ChatGPT (Microsoft je vložil milijarde) in mora svojo izjemno priljubljeno umetno inteligenco spremeniti v »izdelek, ki prinaša denar« wired.com. Agenti bi lahko bili ključ do te monetizacije na več načinov:
- Nadgradnja naročnine: Preprosto povedano, način agenta je premijska funkcija, ki bi lahko pritegnila več uporabnikov k plačljivim paketom. S tem, ko je omejen na naročnike Plus/Pro, OpenAI naredi mesečno naročnino v višini 20 $+ bolj privlačno za zahtevne uporabnike, ki želijo AI pomočnika za razbremenitev dela. To je neposredna in enostavna monetizacija: pridobiti več ljudi, ki plačujejo za dostop do ChatGPT.
- Transakcijske provizije: Izvršni direktor OpenAI Sam Altman je namignil na zaslužek s provizijami od trgovanja, opravljenega prek njihove umetne inteligence. Namigoval je, da bi lahko OpenAI “zaračunal 2 % provizije od ustvarjene prodaje” prek prizadevanj svojega pomočnika theguardian.com. Z drugimi besedami, če vam ChatGPT Agent pomaga kupiti izdelek ali rezervirati hotel, bi lahko OpenAI prejel majhen delež (od trgovca ali prek partnerskih povezav). Ta model bi spremenil nakupovanje ali rezervacije, ki jih poganja AI, v vir prihodka. Nedavna predstavitev agenta, ki je uporabnika vodila do blagajn na drobno, je takoj sprožila ugibanja, da bi lahko OpenAI v prihodnosti vključil takšne partnerske ali napotitvene provizije theguardian.com.
- Sponzorirani rezultati/oglasi: AI pomočniki bi lahko postali nova platforma za oglaševanje. Če agent predlaga izdelke ali restavracije, bodo blagovne znamke plačale, da jih priporoča? “Neka različica oglasov ali sponzoriranih umestitev se zdi neizogibna,” opaža analitičarka Niamh Burns in izpostavlja “naraščajoč pritisk [na AI podjetja], da monetizirajo svoje izdelke.” theguardian.com Obstaja precedens – iskalniki služijo z oglasi, zato bi lahko tudi AI, ki nadomesti iskanje. Vendar pa OpenAI zanika kakršnokoli trenutno uporabo sponzorirane vsebine v priporočilih ChatGPT Agenta theguardian.com. Izjavili so, da agent ne vključuje plačanih umestitev izdelkov in da “ni načrtov, da bi to spremenili.” theguardian.com Za zdaj naj bi bili rezultati izključno na podlagi uporabnikovih kriterijev in presoje AI. Vseeno pa ostaja možnost za prihodnje oglaševalske modele, ko bo ekosistem pomočnikov dozorel.
- Podjetniške storitve: OpenAI bi lahko prav tako monetiziral z vključitvijo agenta kot del rešitev za poslovno programsko opremo. Na primer, podjetja bi lahko plačevala za integracijo ChatGPT Agenta v svoja interna orodja ali za to, da bi agent prevzel podporo strankam. OpenAI je že v pogajanjih s podjetjem Microsoft glede nadaljevanja partnerstva in zlahka si je predstavljati, da bi napredni agenti bili vključeni v Microsoftove ponudbe (kar bi lahko posredno prineslo prihodek ali ugodnejše pogoje za OpenAI) wired.com. “poslovne uporabe” so bile pomemben dejavnik pri zasnovi agenta, pravi vodja produkta Yash Kumar wired.com, kar pomeni, da OpenAI verjetno razmišlja o tem, kako lahko podjetja izkoristijo (in plačajo za) to tehnologijo.
Na kratki rok se bo OpenAI verjetno osredotočil na izpopolnjevanje agenta in pridobivanje naročnin. A če bodo agenti postali tako uporabni, kot obljubljajo, bodo lahko omogočali celotne transakcije ali delovne tokove – in OpenAI bo zagotovo želel iz tega iztržiti nekaj vrednosti. Podjetje mora uravnotežiti zaupanje uporabnikov (agent, ki priporoča izdelke, mora delovati nepristransko, da mu bodo zaupali) z monetizacijo. Kako jim bo to uspelo, bo pod drobnogledom. Kot se je vprašal analitik Burns, če agent najde izdelke namesto vas, “kaj vse je vključeno v proces, ko sistem išče izdelke? Bi lahko obstajali komercialni dogovori, kjer bi blagovne znamke plačevale, da jih pomočniki izpostavijo…?” theguardian.com. OpenAI za zdaj vztraja, da ne, a ekonomski motiv je prisoten.
Reakcije strokovnjakov in pričakovanja
Predstavitev ChatGPT Agenta je med strokovnjaki in prvimi uporabniki sprožila tako navdušenje kot previdne komentarje. Ethan Mollick, profesor na Whartonu, znan po eksperimentiranju z umetno inteligenco v izobraževanju, je bil del majhne skupine z zgodnjim dostopom. Njegova ocena je bila optimistična: “ChatGPT agent je, mislim, velik korak naprej pri tem, da AI-ji opravljajo pravo delo. Že v tej fazi dobro samostojno opravlja raziskave in sestavlja Excel datoteke (tudi s formulami!), PowerPoint itd.”techmeme.com. Mollick je dejal, da daje vpogled v to, kako se različne sposobnosti agentov “združujejo”, čeprav še ni popolntechmeme.com. Tudi drugi raziskovalci umetne inteligence so izrazili podobno mnenje in so navdušeni nad tem, kako lahko ChatGPT Agent povezuje naloge in ustvarja uporabne rezultate, za katere je bilo prej potrebnih veliko ročnih korakov.
Obenem pa se zavedajo, da se je testiranje v resničnem svetu šele začelo. Kako zanesljivo agent obvladuje neurejen odprt internet, ali se lahko izogne prevaram ali dezinformacijam med brskanjem in v kolikšni meri povprečni uporabniki menijo, da je resnično uporaben – to so odprta vprašanja. »Še vedno je treba videti, kako sposoben je v resničnem svetu,« je zapisal TechCrunch, saj so bili prejšnji agenti krhki ob nepričakovanih scenarijih techcrunch.com. Obstaja tudi širša družbena skrb glede podeljevanja večje avtonomije umetni inteligenci: tudi z dovoljenji bodo zagotovo prišle na dan zgodbe o nenavadnih ali tveganih odločitvah AI. OpenAI-jeva lastna sistemska kartica priznava »nove tveganja« pri takšni avtonomiji in obljublja nadaljnje raziskave za njihovo ublažitev openai.com openai.com.Za zdaj uvedba ChatGPT Agenta predstavlja mejnik v pohodu umetne inteligence od zgolj asistivnega generiranja besedila do dejanskega izvajanja nalog. To je del paradigmatskega premika od »klepetalnikov« k »agentom« – sistemom umetne inteligence, ki lahko prevzamejo pobudo in izpolnjujejo cilje v digitalnem svetu, ne le klepetajo. »Agent je trenutno najbolj vroča beseda,« piše WIRED, prav zato, ker toliko podjetij sledi tej viziji wired.com. OpenAI je jasno postavil svojo zastavo na tem novem področju, saj izkorišča priljubljenost in prepoznavnost ChatGPT, da agent približa množicam (ali vsaj plačljivim uporabnikom).
Bistvo: Če ste upravičen uporabnik ChatGPT, lahko zdaj določene dolgočasne ali zapletene naloge prepustite AI pomočniku in ga opazujete, kako jih opravlja korak za korakom. Občutek je lahko skoraj čaroben – kot bi imeli vestnega pripravnika, ki nikoli ne spi – in hkrati nekoliko zaskrbljujoč, ko vidite, da AI samostojno brska po spletu. Ta predstavitev je začetek velikega eksperimenta, kako bi lahko vsakdanji ljudje uporabljali AI agente. Kot je dejal eden izmed prvih uporabnikov: »[Agent] samostojno dobro opravi delo… Daje občutek, kako se agenti združujejo.«techmeme.com V prihodnjih mesecih bomo videli, ali ChatGPT Agent res izpolni obljubo o priročnosti in produktivnosti ter kako se primerja z vse večjo konkurenco AI pomočnikov. Eno je gotovo: doba umetne inteligence, ki deluje, ne le klepeta, se je uradno začela.
Viri:
- Booth, R. (2025, 17. julij). The Guardian – OpenAI lansira osebnega asistenta, ki je sposoben upravljati datoteke in spletne brskalnike. theguardian.com theguardian.com theguardian.com theguardian.com theguardian.com
- OpenAI. (2025, 17. julij). Predstavljamo ChatGPT Agent: Povezovanje raziskav in dejanj (Uradni OpenAI blog) openai.com openai.com openai.com openai.com
- Field, H. (2025, 17. julij). The Verge – Novi ChatGPT Agent podjetja OpenAI lahko upravlja celoten računalnik in opravlja naloge namesto vas. theverge.com theverge.com theverge.com theverge.com
- Zeff, M. (2025, 17. julij). TechCrunch – OpenAI lansira splošnonamenskega agenta v ChatGPT. techcrunch.com techcrunch.com techcrunch.com techcrunch.com
- Rogers, R. (2025, 17. julij). WIRED – Novi agent ChatGPT podjetja OpenAI poskuša narediti vse. wired.com wired.com wired.com wired.com
- Techmeme. (2025, 17. julij). Združene tehnološke novice o lansiranju ChatGPT Agenta (vključno s komentarjem Ethana Mollika)techmeme.com