LIM Center, Aleje Jerozolimskie 65/79, 00-697 Warsaw, Poland
+48 (22) 364 58 00

OpenAI slepper laus ChatGPT-agenten – den KI-assistenten som kan planleggje, handle og lage PowerPointar for deg

OpenAI slepper laus ChatGPT-agenten – den KI-assistenten som kan planleggje, handle og lage PowerPointar for deg

OpenAI Unleashes ChatGPT Agent – The AI Assistant That Can Plan, Shop and Make PowerPoints For You

ChatGPT utviklar seg frå chatbot til personleg assistent

OpenAI har lansert ein stor oppgradering av ChatGPT, som gjer den populære chatboten om til ein personleg AI-assistent som ikkje berre kan svare på spørsmål, men også utføre handlingar på vegner av brukaren. Den nye funksjonen, kalla ChatGPT “Agent”, vart lansert torsdag og lar ChatGPT “tenkje” og handle ved å bruke sin eigen virtuelle datamaskin theguardian.com. I praksis kan brukarar no be ChatGPT om å handtere oppgåver i fleire steg – frå å finne restaurantreservasjonar eller handle på nett til å generere komplette rekneark og presentasjonar heilt automatisk theguardian.com. OpenAI seier at denne agent-modusen lar AI-en navigere på nettsider, kontrollere nettlesarar og appar, handtere filer og lage utdata som Excel-filer eller PowerPoint-presentasjonar, i staden for berre å gi tekstsvartechmeme.com.

Kvifor dette er viktig: Oppgraderinga er OpenAI sitt mest dristige steg så langt for å gå bort frå ein statisk Q&A-chatbot mot ein AI som fungerer som ein digital assistent eller “agent.” I motsetnad til vanlege chatbotar kan AI-agentar utføre komplekse, fleirstegs arbeidsflytar ved å samhandle med programvare og nettsider på vegner av brukaren theverge.com. “Håpet er at agentar kan gi reell nytte for brukarane – faktisk gjere ting for dei i staden for berre å levere polert tekst og høyrest imponerande ut,” seier Niamh Burns, senior mediaanalytikar i Enders Analysis theguardian.com. I hovudsak er målet med ChatGPT sin nye agent-modus å oppfylle dette løftet ved å gjere ekte nettarbeid for brukarane, ikkje berre chatte.

OpenAI sin ChatGPT Agent brukar ein innebygd “virtuell datamaskin” til å surfe på nettet, fylle ut skjema, køyre kode og til og med lage Excel-rekneark eller PowerPoint-presentasjonar på vegner av brukaren openai.comtechmeme.com.

Kva kan den nye ChatGPT Agent gjere?

OpenAI omtalar ChatGPT Agent som ein digital assistent for allment bruk som kan handtere eit breitt spekter av datamaskinbaserte oppgåver techcrunch.com. Nokre døme på kva den kan gjere, er:

  • Handtere timeplanar og planar: Sjekk kalenderen din og gi deg ei oversikt over komande møte, eller finn ein kveld du er ledig og søk etter bordreservasjonar på OpenTable openai.com theverge.com. Den kan planleggje arrangement som ein datekveld ved å kryssjekke timeplanen din med restauranttilgjenge.
  • Nettbasert forsking og rapportar: Gjer grundig nettsøk på eit tema og lag ein kortfatta rapport eller analyse. Til dømes kan den analysere trendar (t.d. “veksten av Beanie Babies vs. Labubus”) og lage eit samandrag eller ein detaljert forskingsrapport theverge.com.
  • Netthandel og bestillingar: Agenten kan gjere netthandel for deg. Du kan be den finne produkt med visse kriterium, samanlikne alternativ, og til og med leggje inn bestillingar (med di godkjenning) theguardian.com wired.com. OpenAI sin forskingsleiar Isa Fulford fekk til og med agenten til å bestille eit brett med cupcakes ved å følgje hennar spesifikke instruksjonar – ei oppgåve som “tok nesten ein time” men likevel var lettare for henne enn å gjere det manuelt wired.com.
  • Kontoroppgåver – Rekneark og presentasjonar: Kanskje mest merkeleg er at ChatGPT Agent kan lage redigerbare filer. Den kan generere eit Excel-rekneark eller ein PowerPoint-presentasjon frå grunnen av basert på det du skriv inn openai.com. Til dømes kan du be han analysere data om konkurrentane dine og lage ein presentasjon med diagram som oppsummerer funna openai.com. Han kan òg oppdatere rekneark med nye data eller gjere eit sett med skjermbilete om til ein formatert presentasjon openai.com. Utskriftsfilene kan lastast ned og er meint for bruk i vanleg kontorprogramvare (men OpenAI åtvarar om at presentasjonsfunksjonen framleis er i beta) openai.com.
  • Bruk utviklarverktøy og API-ar: Under panseret har agenten tilgang til ein programmeringsterminal og kan kalle på offentlege API-ar. Dette betyr at han kan køyre kode for å gjere eigne utrekningar eller hente data frå eksterne tenester. Han kan integrerast med appar som Gmail eller GitHub via “connectorar”, og hente inn informasjon (med brukartillatelse) for å bruke i svara sine openai.com. OpenAI seier ChatGPT Agent til og med kan fylle ut nettskjema og samhandle med tenester som Google Drive eller SharePoint ved å bruke API-kall wired.com.

Alle desse funksjonane blir styrte ved å gi KI-en sin eigen “virtuelle nettlesar/datamaskin” å jobbe i. Når du gir ein oppgåve, vil ChatGPT navigere på nettsider, klikke på lenker eller knappar, rulle på sider, fylle ut tekstfelt, skrive og køyre kode, og så vidare – kva enn som trengst for å fullføre oppgåva openai.comtechmeme.com. Han jobbar stegvis og sjølvstendig, og bestemmer sjølv kva verktøy eller nettside som skal brukast vidare. Til dømes kan planlegging av ein japansk middag innebere å søke etter oppskrifter på Google, så opne ei matvare-nettside for å bestille ingrediensar, og til slutt lage eit rekneark med handleliste – alt gjort av agenten utan at brukaren må styre kvart steg.

Korleis fungerer ChatGPT Agent?

Bak kulissane er ChatGPT Agent driven av ein ny AI-modell som OpenAI har bygd spesielt for agentoppgåver, separat frå grunnmodellen GPT-4 theverge.com. Modellen vart trena med forsterkingslæring for å handtere komplekse oppgåver som krev bruk av fleire verktøy (som nettlesarar, API-ar og kode) i rekkefølgje theverge.com. Faktisk slo OpenAI saman to tidlegare eksperimentelle system – Operator (eit verktøy for nettlesing/automatisering) og Deep Research (eit verktøy for djupare analyse) – til denne samla agenten. “Vi innsåg at dei to produkta utfyller kvarandre veldig godt, og bestemte oss i praksis for å slå saman teama,” seier Fulford wired.com. Resultatet er ein agent som kombinerer Operator si evne til å navigere på nettet med Deep Research si ferdigheit i å syntetisere informasjon i eitt arbeidsflyt wired.com.

Verktøykasse av ferdigheiter: ChatGPT Agent kjem utstyrt med fleire spesialiserte verktøy den kan bruke openai.com:

  • Ein visuell nettlesar for å samhandle med nettsider gjennom eit vanleg grafisk grensesnitt, slik eit menneske ville gjort (klikke på knappar, navigere sider).
  • Ein tekstbasert nettlesar for å sende raske HTTP-forespurnader og tolke råtekst (nyttig for rask lesing av store tekstmengder eller når visuell vising ikkje er nødvendig) openai.com.
  • Ein terminal/konsoll som lar den køyre kode, manipulere filer eller bruke kommandolinjeverktøy innanfor sitt sandkassa-miljø openai.com.
  • Direkte API-tilgang, som gjer at den kan kalle eksterne tenester sine API-ar (t.d. legge inn i Google Kalender, spørje ein database, eller hente data frå ei nettbasert teneste) openai.com.
  • Koplingar til brukarkontoar: Brukarar kan kople til eigne appar (som e-post eller GitHub). Med løyve kan agenten hente inn relevant informasjon frå e-postane dine, kalenderen din eller andre kontoar for å utføre oppgåver openai.com. Til dømes kan han skanne Gmail-en din for nylege meldingar om det trengst for å lage eit samandrag, eller sjekke kalenderen din via ein API for å finne ledige tidspunkt.

Desse verktøya let AI-en velje den optimale tilnærminga for ei oppgåve. Han kan bruke API-en for raskt å sjekke kalenderen din, og deretter bytte til den visuelle nettlesaren for å navigere på ei OpenTable-reservasjonsside som krev klikking og menneskeleg liknande interaksjon openai.com. Han kan laste ned ei fil via tekstnettlesaren eller API, køyre kode på ho i terminalen for å analysere eller omformatere ho, og så opne resultata i den visuelle nettlesaren for å vise dei til deg openai.com. Alt dette skjer inne i agenten sin virtuelle maskin, isolert frå den faktiske eininga di – så det er som om AI-en har sin eigen datamaskin der han utfører instruksjonane dine openai.com.

Brukaroppleving: For sluttbrukaren er det enkelt å bruke ChatGPT Agent. Funksjonen er tilgjengeleg via ein ny “Agent-modus” i ChatGPT-grensesnittet for dei som har tilgang openai.com. Du startar berre eit spørsmål med ei oppgåve (du kan òg skrive ein skråstrek-kommando “/agent”) og AI-en tek over derfrå theverge.com. Mens han jobbar, viser ei forteljing på skjermen kva agenten gjer steg for steg – til dømes, “Blaar til maps.google.com… Søkjer etter ‘italienske restaurantar nær meg’…” – slik at du kan følgje med openai.com openai.com. Merk at du kan avbryte eller styre agenten når som helst: du kan pause prosessen for å presisere instruksjonane dine eller be han ta ein annan tilnærming, og han vil tilpasse seg undervegs utan å miste framdrift openai.com. Denne samarbeidsløypa er meint å halde AI-en på linje med måla dine.

Tryggleiksfunksjonar: Å halde AI-handlingar i sjakk

Å gi ein AI moglegheit til å handle på nettet reiser openberre tryggleiksbekymringar, og OpenAI erkjenner at denne nye modusen kjem med “meir risiko enn tidlegare modellartheguardian.com. For å avgrense desse, har OpenAI innført ein rekke tryggleikstiltak og avgrensingar:

  • Brukarstadfesting for sensitive handlingar: “Du har alltid kontrollen,” understrekar OpenAI theguardian.com. ChatGPT Agent vil be om eksplisitt stadfesting før den gjer noko med alvorlege konsekvensar, som å gjennomføre eit kjøp, sende ein e-post, eller bestille ei reservasjon på dine vegner theguardian.com theverge.com. Brukaren må godkjenne desse irreversible stega, og hindrar slik at AI-en til dømes impulsivt bestiller varer for 1 000 dollar på Amazon utan at du veit det.
  • Avgrensingar på “høg-risiko”-innhald (bio/kjemi): Gitt agenten sine utvida evner, har OpenAI klassifisert han under ein “kategori for høg biologisk og kjemisk risiko”, sjølv om dei har “ingen endeleg dokumentasjon” på at den kan bidra til å lage eit biologisk våpen theguardian.com theverge.com. Dette føre var-tiltaket (del av OpenAI sitt Preparedness Framework) betyr at ekstra tryggleikstiltak er aktive. Konkret køyrer OpenAI ein sanntids innhaldsklassifiserar på kvar agent-forespurnad for å sjå om det er relatert til biologi eller kjemi, og i så fall blir agentens svar vurdert av ein ekstra tryggleiksmodell for å sikre at det ikkje gir farlege instruksjonar techcrunch.com techcrunch.com. Med andre ord, om nokon prøver å misbruke agenten til å til dømes lage eit giftig stoff, er systemet utforma for å fange det opp og stoppe det.
  • Trent opp til å avslå skadelege oppgåver: Agenten er trent til å avvise visse mistenkelege eller skadelege førespurnader. Til dømes vil han nekte dersom han blir beden om å utføre noko openbert farleg eller uetisk, som å gjennomføre ein bankoverføring til ein ukjend konto eller køyre destruktive kommandoar theguardian.com. OpenAI seier at red-teamarar og domenespesialistar har hjelpt til med å teste systemet mot “realistiske scenario” for å styrke desse avslaga openai.com.
  • Langtidsminne deaktivert: Ei interessant avgrensing – ChatGPT sitt langtidsminne for samtalar er slått av i agentmodus techcrunch.com. Vanlegvis kan ChatGPT hugse informasjon frå tidlegare i ein samtale eller frå tidlegare økter (om det er slått på), men OpenAI var uroa for at ein smart angripar kunne utnytte dette under agentoppgåver (via såkalla prompt injections) for å få agenten til å lekke sensitiv informasjon eller gjere uønskte ting techcrunch.com. Som eit resultat opererer agenten no utan tilstand, og tek ikkje med seg informasjon frå tidlegare samtalar. OpenAI kan slå på minnet igjen i framtida når dei er trygge på at det er sikkert, men for no unngår dette “ekstra føre var-tiltaket” potensielle datalekkasjar wired.com.
  • Finansielle transaksjonar ikkje tillate: OpenAI har òg avgrensa finansielle operasjonar for no. Agenten vil ikkje gjennomføre pengeoverføringar eller aksjehandel, til dømes, sjølv om han blir beden om det theverge.com. Det finst faktisk ein sikring kalla “Watch Mode” som slår inn dersom agenten er inne på visse sensitive nettsider (som bankar eller handelsplattformer) – han vil pause aktiviteten sin dersom brukaren forlet agenten si nettlesarfane, for å hindre lumske handlingar i bakgrunnen theverge.com.
  • Omfattande testing og belønningsprogram: OpenAI framhevar at denne modellen har deira “mest omfattande tryggleiksstabel til no” når det gjeld trusselmodellering og overvaking openai.com openai.com. Dei samarbeidde med eksterne biotryggleiksekspertar og hadde domenespesialistar til å red-team agenten før lansering openai.com. Samstundes med lanseringa publiserte OpenAI òg eit detaljert systemkort som forklarer risikoar, og dei tilbyr ein bug bounty for å oppmode eksterne forskarar til å rapportere sårbarheiter openai.com openai.com.

Trass i desse førebyggjande tiltaka veit OpenAI at uventa åtferd likevel kan oppstå når ein AI opererer på det ville internettet. Selskapet seier dei vil forbetre agenten stegvis og justere tryggleikstiltak etter behov. For no vert brukarar råda til å overvake handlingane til agenten (grensesnittet oppmodar til dette ved å fortelje om kvart steg). “Med denne modellen er det fleire risikoar enn med tidlegare modellar,” innrømmer OpenAI, og difor “utviser dei varsemd og innfører nødvendige tryggleikstiltak no” theguardian.com theguardian.com.

Tidlege avgrensingar: Fart og pålitelegheit

Ikkje spark den menneskelege assistenten din heilt endå. I tidlege demoar og testing har ChatGPT Agent vist imponerande evner, men òg merkbare avgrensingar:

  • Sakte og stødig: Agenten brukar ofte ei stund på å fullføre oppgåver. Han kan bruke fleire minutt på å klikke og bla for å samle informasjon, mykje lenger enn eit direkte svar frå ein chatbot. I ein demonstrasjon tok det agenten om lag 10–15 minutt å gå gjennom Google Kalender og restaurantnettstader for å foreslå middagsalternativ theguardian.com. Å lage ein kompleks lysbiletpresentasjon eller utføre omfattande undersøkingar kan ta endå lenger tid (OpenAI-tilsette opplyste at ei lysbiletopgåve tok ca. 25 minutt under testing) wired.com. «Sjølv om det tek 15 minutt, ein halvtime, er det ein ganske stor tidsbesparing samanlikna med kor lang tid det ville tatt deg å gjere det sjølv,» meiner Fulford, og peikar på at brukarar kan setje i gang ei oppgåve og så gjere andre ting medan agenten jobbar theverge.com. Likevel krevst det tolmod; agenten er ikkje umiddelbar. OpenAI sin Yash Kumar anslår at ei gjennomsnittleg oppgåve tek ca. 10–15 minutt i den noverande versjonen wired.com.
  • Av og til problem: Som med all AI kan agenten gjere feil eller bli “fastlåst” i ei oppgåve. Tidlege brukarar har rapportert blanda resultat. Nokre komplekse arbeidsflytar kan forvirre han, eller han kan mistolke ei instruks undervegs. Ein tidleg testbrukar kommenterte at agenten “feila på dei tre ulike oppgåvene eg gav han… Eit fint glimt av framtida, men ikkje vanlegvis nyttig enno.”techmeme.com. Dette understrekar at teknologien, sjølv om han er avansert, ikkje er feilfri. OpenAI sjølv påpeiker at agenten er “framleis i ein tidleg fase” og “kan framleis gjere feil.” openai.com Framtidige oppdateringar er venta å betre pålitelegheit og resonneringsevne.
  • Grunnleggjande utgangskvalitet: PowerPoint-/lysbildefunksjonen er for tida i beta, noko som betyr at lysbileta den lagar kan sjå ganske enkle ut eller trenge finpuss openai.com. OpenAI har først og fremst fokusert på å få innhald og struktur rett, heller enn eit glitrande design. Dei åtvarar om at formateringa kan vere enkel, og av og til er det forskjellar mellom lysbildevisinga og den eksporterte PowerPoint-fila openai.com. På same måte kan agenten redigere rekneark og halde på formlar, men er enno ikkje ein Excel-ekspert på nivå med eit dyktig menneske. OpenAI trenar allereie neste versjon til å lage meir “polerte, sofistikerte utdata” i presentasjonar openai.com.
  • Ingen lansering i Europa (enno): Merk at ChatGPT-agenten ikkje vart lansert i EU. OpenAI “arbeider framleis med å gjere tilgangen mogleg for Det europeiske økonomiske samarbeidsområdet og Sveits” openai.com. Brukarar andre stader (inkludert USA og Storbritannia) fekk tilgang med ein gong, men europeiske brukarar må vente på ubestemt tid. OpenAI har ikkje gitt noko fast tidslinje for EU-lansering theverge.com. Dette er truleg knytt til reguleringsomsyn – EU sine strenge data- og AI-reglar kan krevje ekstra etterlevingssteg frå OpenAI før dei kan sleppe laus ein autonom agent. For no ser europearar berre ei melding om at funksjonen ikkje er tilgjengeleg i deira region.
På den positive sida hev OpenAI hevda at den nye agenten sin underliggjande modell er langt meir kapabel enn tidlegare versjonar, noko som lover godt for å handtere kompleksitet. Modellen skal visstnok ha oppnådd toppresultat på fleire vanskelege referansetestar techcrunch.com. Til dømes fekk den 41,6 % på “Humanity’s Last Exam,” ein omfattande ekspert-test som dekkjer over 100 fag – om lag dobbelt så høg poengsum som OpenAI sine tidlegare modellar på den testen techcrunch.com. På ein berykta vanskeleg matte-test (FrontierMath), klarte den 27,4 % nøyaktigheit med verktøybruk, mot berre 6,3 % for den beste tidlegare modellen techcrunch.com. Desse forbetringane tyder på at agenten er mykje betre til å løyse komplekse, fleirstegs problem når den kan bruke verktøy. “OpenAI seier ChatGPT-agenten er langt meir kapabel enn tidlegare tilbod,” rapporterer TechCrunch techcrunch.com – men før fleire brukarar pressar den til grensene i verkelege situasjonar, gjenstår det å sjå kor “kapabel” den eigentleg er utanfor kontrollerte testar techcrunch.com.

Tilgjenge: Kven kan bruke ChatGPT-agenten?

OpenAI rullar i første omgang ut ChatGPT-agenten som eit gode for betalande abonnentar berre. Frå og med denne veka blir funksjonen aktivert for brukarar på ChatGPT Pro, Plus og Team-planane (omtrent tilsvarande premium-nivå) techcrunch.com. Pro-brukarar skulle få tilgang først (på lanseringsdagen), etterfølgt av Plus- og Team-abonnentar dei neste dagane openai.com. Bedrifts- og utdanningskundar får det “i løpet av dei neste vekene” når barnesjukdomane er retta opp openai.com theverge.com. Det er ingen kunngjord tidsplan for gratisbrukarar for å få agent-funksjonar – og det er mogleg det vil forbli ein betalfunksjon i overskodeleg framtid, gitt den ekstra verdien og dei høge reknekostnadene som er involvert.

Saman med trinnbasert tilgang har OpenAI innført månadlege bruksgrenser. Pro-abonnentar (det høgaste nivået) kan køyre opp til 400 agentoppgåver per månad, medan Plus- og Team-brukarar får 40 oppgåver per månad inkludert wired.com wired.com. Denne grensa sikrar at dei kostbare operasjonane ikkje går løpsk, men ekstra bruk kan vere tilgjengeleg for kjøp via eit kredittsystem om brukarane treng meir openai.com. Oppgåvene blir rekna per “agentisk prompt”, altså kvar gong du aktiverer agenten for å gjere noko, tel det som éi oppgåve.

Som nemnt, kan ikkje europeiske brukarar få tilgang til ChatGPT Agent ved lansering theguardian.com. Når brukarar utanfor EU slår på agentmodus, får dei ei åtvaring om at funksjonen er eksperimentell, og kan deretter halde fram. EU-brukarar blir derimot berre blokkerte. OpenAI si melding om at dei jobbar med tilgang i EØS tyder på at forseinkinga truleg handlar om å følgje EU-regelverk (kanskje knytt til personvern og AI-lova). Denne geografiske utrullinga minner om korleis tidlegare ChatGPT-funksjonar (som nettlesing) midlertidig vart haldne tilbake i enkelte regionar på grunn av juridisk uvisse. For no må alle i EU vente til OpenAI sikrar at agenten oppfyller lokale krav.

Kappløp om AI-agentar – Google, Anthropic & andre

OpenAI si satsing på “agentisk” AI kjem midt i ein større bransjetrend mot autonome AI-assistentar. Faktisk har konkurrentar også førebudd eigne agentliknande funksjonar:

  • Anthropic sin Claude: I fjor introduserte Anthropic (skaparen av Claude-chatboten) ein funksjon kalla “Computer Use” – som i praksis gir Claude evna til å bruke ein datamaskin som eit menneske, til dømes å surfe på nettstader og utføre oppgåver på brukarens maskin theverge.com. Berre for to månader sidan (mai 2025) lanserte Anthropic sin nyaste modell Claude 2 (kodenamn Opus 4) med agentiske funksjonar og aktiverte spesielle biosikkerheitstiltak for å hindre misbruk theverge.com. Dette viser at sjølv mindre AI-oppstartar er medvitne om både krafta og risikoen ved autonome agentar.
  • Googles AI-utvidingar: Google har jobba med å integrere sin generative AI (som Bard og Assistant) med direkte handlingar. Dei har demonstrert AI som kan skrive utkast til e-postar i Gmail, oppsummere dokument i Google Drive, og til og med styre ein nettlesar gjennom den eksperimentelle “Duet AI” for Workspace. The Guardian peikar på at Google nyleg lanserte liknande assistent-“agentar” som kan bytte mellom appar for å utføre brukaroppgåver theguardian.com. I tillegg, berre førre veke tilsette Google nøkkelpersonell frå ein oppstartsbedrift (Windsurf) spesielt for å styrke sine agentiske AI-prosjekt theverge.com, noko som understrekar konkurransen om å bygge Jarvis-liknande assistentar.
  • Andre aktørar: Meta (Facebook) og Amazon har òg nemnt AI-agentambisjonar på resultatpresentasjonar, noko som tyder på at alle i Big Tech ser dette som det neste store theverge.com. Til dømes ser netthandelsselskap for seg AI-agentar som kan handtere kundeservice-chattar eller handleførespurnader frå start til slutt. Eit slående tidleg døme er fintech-selskapet Klarna, som rapporterte tidleg i 2024 at deira AI-kundeserviceagent handterte to tredelar av alle kundechattar, og gjorde arbeidet til om lag 700 menneske theverge.com. Den suksesshistoria var med på å popularisere omgrepet “AI-agent” i næringslivet, og sidan då har mange toppleiarar snakka varmt om agentbasert AI som eit mål theverge.com.
  • Tidlegare eksperiment: OpenAI sjølv har tidlegare prøvd seg på agentar. I januar 2025 lanserte dei Operator som ein forskingsversjon, skildra som “ein agent som kan gå på nettet for å utføre oppgåver for deg” theverge.com. Operator kunne klikke og bla gjennom nettsider. Det fanst òg Deep Research-modus som kunne skrive lengre analysar. Desse forløparane var likevel avgrensa i omfang og til tider ustabile. Andre oppstartsbedrifter (som Adept AI sin ACT-1) har vist agentar som kan utføre kommandoar i programvare som eit menneske, men ingen har enno blitt mainstream-produkt. Dei tidlege generasjonane av AI-agentar sleit med komplekse oppgåver og pålitelegheit techcrunch.com – og kravde ofte mykje oppfølging. Teknologitoppar teikna visjonar av AI-assistentar som kunne gjere alt, men røynda låg etter hypen techcrunch.com.

No, med ChatGPT Agent, prøver OpenAI å hoppe forbi desse tidlegare forsøka. Ved å kombinere styrkar (nettsurfing + analyse) og bruke intelligens på GPT-4-nivå, hevdar dei å ha ein agent som endeleg nærmar seg den store visjonen. “Dette er den beste brukaropplevinga for ein agent nokon gong. FULLSTENDIG VILT. SLÅ DENNE!!” skreiv ein entusiastisk brukar etter lanseringatechmeme.com. Sjølv om det er openbert overdriving, fangar det entusiasmen i delar av AI-miljøet for at vi nærmar oss ein “J.A.R.V.I.S.” – Iron Man sin fiktive AI-butler – i verkelegheita theverge.com. For no er ChatGPT Agent og liknande framleis tidlege steg mot det idealet, og handterer mest forsking, koding og enkle nettopgåver heller enn verkeleg open slutt-autonomi theverge.com. Men konkurransen er tydeleg: kvar AI-bedrift vil vere først til å løyse AI-assistenten som folk faktisk vil bruke dagleg.

Inntekter: Vil agentar tene pengar for OpenAI?

Med lanseringa av ChatGPT Agent viser OpenAI ikkje berre fram ny teknologi – dei ser òg etter potensielle inntektsstraumar. Selskapet har sterkt subsidiert utviklinga av ChatGPT (med Microsoft som har investert milliardar), og treng å gjere den svært populære AI-en om til eit “pengemaskin-produkt” wired.com. Agentar kan vere nøkkelen til den inntektsstraumen på fleire måtar:

  • Abonnement-oppgradering: Enkelt sagt er agentmodus ein premium-funksjon som kan få fleire brukarar til å velje betalte abonnement. Ved å avgrense det til Plus/Pro-abonnentar, gjer OpenAI den månadlege prisen på $20+ meir attraktiv for avanserte brukarar som ønskjer ein AI-assistent til å avlaste arbeid. Dette er den enkle, umiddelbare måten å tene pengar på: få fleire til å betale for tilgang til ChatGPT.
  • Transaksjonsgebyr: OpenAI-sjef Sam Altman har antyda at dei kan tene provisjonar frå handel gjort via AI-en deira. Han spekulerte i at OpenAI kunne “ta eit gebyr på 2 % av salet” gjennom assistenten si hjelp theguardian.com. Med andre ord, om ChatGPT Agent hjelper deg å kjøpe eit produkt eller bestille eit hotell, kan OpenAI ta ein liten del (frå seljaren eller via affiliate-lenker). Denne modellen vil gjere AI-styrt handel eller booking til ein inntektskjelde. Den siste agent-demoen som viste at den guida ein brukar til utsjekk i nettbutikk førte straks til spekulasjonar om at OpenAI kan integrere slike affiliate- eller henvisningsgebyr etter kvart theguardian.com.
  • Sponsa resultat/annonser: AI-assistentar kan bli ein ny plattform for annonsering. Om ein agent foreslår produkt eller restaurantar, vil merkevarer betale for å bli anbefalt? “Ein eller annan versjon av annonser eller sponsa plassering verkar uunngåeleg,” seier analytikar Niamh Burns, og peikar på “auka press [på AI-selskap] for å tene pengar på produkta sine.” theguardian.com Det finst eit førebilete – søkemotorar tener pengar på annonser, så ein AI som erstattar søk kan også gjere det. Likevel avviser OpenAI at dei brukar sponsa innhald no i ChatGPT Agent sine tilrådingar theguardian.com. Dei seier at agenten ikkje inkluderer betalte produktplasseringar, og “det er ingen planar om å endre det.” theguardian.com For no skal resultata vere basert berre på brukarens kriterium og AI-en si vurdering. Likevel er døra open for framtidige annonsemodellar når assistent-økosystemet har modna.
  • Tenestetenester: OpenAI kan òg tene pengar ved å tilby agenten som ein del av programvareløysingar for verksemder. Til dømes kan selskap betale for å integrere ChatGPT Agent i sine interne verktøy eller for å la den handtere kundestøtte. OpenAI er allereie i kontraktsforhandlingar med Microsoft om vidare samarbeid, og ein kan sjå for seg at avanserte agentar blir pakka inn i Microsoft sine tilbod (noko som indirekte kan gi OpenAI inntekter eller fordelaktige vilkår) wired.com. “Bruksområde for verksemder” var ein stor faktor i utforminga av agenten, ifølgje produkteigar Yash Kumar wired.com, noko som tyder på at OpenAI sannsynlegvis tenkjer på korleis bedrifter kan nytte (og betale for) denne teknologien.

På kort sikt er det sannsynleg at OpenAI vil fokusere på å forbetre agenten og auke talet på abonnement. Men etter kvart, dersom agentar blir så nyttige som lova, kan dei handtere heile transaksjonar eller arbeidsflytar – og OpenAI vil heilt sikkert prøve å hente ut verdi frå det. Selskapet må balansere brukarane si tillit (ein agent som tilrår produkt må verke upartisk for å bli stolt på) med inntening. Korleis dei gjer det, vil bli nøye følgt med på. Som analytikar Burns undra seg: Dersom ein agent finn produkt for deg, “kva ligg bak prosessen der systemet finn produkta? Vil det vere kommersielle avtalar der merkevarer betaler for å bli vist av assistentar…?” theguardian.com. OpenAI insisterer på at det ikkje skjer no, men det økonomiske insentivet er der.

Ekspertreaksjonar og utsikter

Lanseringa av ChatGPT Agent har skapt både begeistring og varsam kommentar frå ekspertar og tidlege brukarar. Ethan Mollick, professor ved Wharton kjend for å eksperimentere med KI i utdanning, var ein del av ei lita gruppe med tidleg tilgang. Hans dom var positiv: “ChatGPT agent er, meiner eg, eit stort steg framover for å få KI-ar til å gjere verkeleg arbeid. Allereie på dette stadiet gjer den ein god jobb med å gjere forsking og setje saman Excel-filer (med formlar!), PowerPoint, osv. på eiga hand.”techmeme.com. Mollick sa det gav eit glimt av korleis ulike agent-evner “kjem saman,” sjølv om det ikkje er perfekt ennotechmeme.com. Andre KI-forskarar støtta dette inntrykket, og var imponerte over korleis ChatGPT Agent kan lenkje saman oppgåver og produsere brukbare resultat som tidlegare kravde mange manuelle steg.

Samtidig er det ei erkjenning av at testing i den verkelege verda nettopp har starta. Kor påliteleg agenten handterer det rotete opne internettet, om han klarer å unngå å gå på svindel eller feilinformasjon medan han surfar, og i kva grad vanlege brukarar faktisk finn han nyttig – det er opne spørsmål. «Det står att å sjå kor kapabel han eigentleg er i den verkelege verda,» noterte TechCrunch, sidan tidlegare agentar har vore skjøre når dei har møtt uventa scenario techcrunch.com. Det er òg ei breiare samfunnsbekymring knytt til å gje meir handlekraft til KI: sjølv med godkjenning og kontrollar vil det heilt sikkert dukke opp historier om KI som tek merkelege eller risikable avgjerder. OpenAI sin eigen systemkort erkjenner «nye risikoar» med slik autonomi og lovar vidare forsking på å redusere desse openai.com openai.com.

For no representerer introduksjonen av ChatGPT Agent ein milepæl i KI si reise frå reint assistentbasert tekstgenerering til faktisk oppgåveløysing. Det er del av eit paradigmeskifte frå «chatbotar» til «agentar» – KI-system som kan ta initiativ og gjennomføre mål i den digitale verda, ikkje berre samtale. «Agent er det mest brukte moteordet akkurat no,» skriv WIRED, nettopp fordi så mange selskap jaktar på den visjonen wired.com. OpenAI har planta flagget sitt tydeleg i dette nye landskapet, og utnyttar populariteten og kjennskapen til ChatGPT for å gjere ein agent tilgjengeleg for massane (eller i det minste dei betalande massane).

Konklusjonen: Dersom du er ein kvalifisert ChatGPT-brukar, kan du no overlate visse kjedelege eller komplekse oppgåver til ein KI-hjelpar og sjå han løyse dei steg for steg. Det kan kjennast litt magisk – som å ha ein pliktoppfyllande praktikant som aldri søv – og òg litt urovekkjande å sjå KI-en surfe rundt på nettet på eiga hand. Denne lanseringa er starten på eit stort eksperiment i korleis vanlege folk kan bruke KI-agentar. Som ein tidleg brukar sa det: «[Han] gjer ein god jobb på eiga hand… Det gir eit inntrykk av korleis agentar byrjar å fungere saman.»techmeme.com I månadene som kjem, vil vi sjå om ChatGPT Agent verkeleg leverer på lovnadene om bekvemmeligheit og produktivitet, og korleis han står seg mot det aukande feltet av konkurrerande KI-assistentar. Éin ting er sikkert: æra for KI som handlar, ikkje berre pratar, har offisielt starta.

Kjelder:

Inside ChatGPT, AI assistants, and building at OpenAI — the OpenAI Podcast Ep. 2

Tags: ,