LIM Center, Aleje Jerozolimskie 65/79, 00-697 Warsaw, Poland
+48 (22) 364 58 00

OpenAI pristato ChatGPT agentą – dirbtinį intelektą, kuris gali planuoti, apsipirkti ir kurti PowerPoint pristatymus jums

OpenAI pristato ChatGPT agentą – dirbtinį intelektą, kuris gali planuoti, apsipirkti ir kurti PowerPoint pristatymus jums

OpenAI Unleashes ChatGPT Agent – The AI Assistant That Can Plan, Shop and Make PowerPoints For You

ChatGPT evoliucionuoja iš pokalbių roboto į asmeninį asistentą

OpenAI pristatė didelį ChatGPT atnaujinimą, paversdama populiarų pokalbių robotą asmeniniu dirbtinio intelekto asistentu, kuris geba ne tik atsakyti į klausimus, bet ir atlikti veiksmus vartotojo vardu. Nauja funkcija, pavadinta ChatGPT „Agentu“, buvo pristatyta ketvirtadienį ir leidžia ChatGPT „mąstyti“ ir veikti naudojant savo virtualų kompiuterį theguardian.com. Praktikoje vartotojai dabar gali paprašyti ChatGPT atlikti kelių žingsnių užduotis – nuo restoranų rezervacijų paieškos ar apsipirkimo internetu iki visų skaičiuoklių ir pateikčių kūrimo savarankiškai theguardian.com. OpenAI teigia, kad šis agento režimas leidžia DI naršyti svetaines, valdyti naršykles ir programas, tvarkyti failus ir kurti tokius rezultatus kaip Excel failai ar PowerPoint pateiktys, o ne tik pateikti tekstinius atsakymustechmeme.com.

Kodėl tai svarbu: Šis atnaujinimas yra drąsiausias OpenAI žingsnis siekiant pereiti nuo statinio klausimų-atsakymų pokalbių roboto prie DI, kuris veikia kaip skaitmeninis asistentas arba „agentas“. Skirtingai nei įprasti pokalbių robotai, DI agentai gali atlikti sudėtingas, kelių žingsnių užduotis, sąveikaudami su programine įranga ir svetainėmis vartotojo vardu theverge.com. „Tikimasi, kad agentai suteiks tikros naudos vartotojams – iš tikrųjų atliks už juos darbus, o ne tik pateiks gražų tekstą ir skambės įspūdingai“, pažymi Niamh Burns, vyresnioji žiniasklaidos analitikė iš Enders Analysis theguardian.com. Iš esmės, naujasis ChatGPT agento režimas siekia išpildyti šį pažadą, atlikdamas realų darbą internete vartotojų labui, o ne tik bendraudamas.

OpenAI ChatGPT agentas naudoja integruotą „virtualų kompiuterį“, kad naršytų internete, pildytų formas, vykdytų kodą ir netgi kurtų Excel skaičiuokles ar PowerPoint pateiktis vartotojo vardu openai.comtechmeme.com.

Ką gali naujasis ChatGPT agentas?

OpenAI pristato ChatGPT Agent kaip universalią skaitmeninę asistentę, galinčią atlikti įvairiausias kompiuteriu pagrįstas užduotis techcrunch.com. Keletas pavyzdžių, ką ji gali atlikti:

  • Tvarkaraščių ir planų valdymas: Patikrinkite savo kalendorių ir gaukite informaciją apie artėjančius susitikimus arba raskite laisvą vakarą ir ieškokite staliuko rezervacijos OpenTable openai.com theverge.com. Ji gali suplanuoti renginius, pavyzdžiui, pasimatymą, suderindama jūsų tvarkaraštį su restorano užimtumu.
  • Tyrimai internete ir ataskaitos: Atlikite išsamius internetinius tyrimus tam tikra tema ir parengkite trumpą ataskaitą ar analizę. Pavyzdžiui, ji gali analizuoti tendencijas (pvz., „Beanie Babies vs. Labubus populiarėjimas“) ir parengti santrauką arba išsamią tyrimo ataskaitą theverge.com.
  • Apsipirkimas ir užsakymai: Agentas gali apsipirkti internetu už jus. Galite paprašyti surasti produktus pagal tam tikrus kriterijus, palyginti pasirinkimus ir netgi pateikti užsakymą (su jūsų leidimu) theguardian.com wired.com. OpenAI tyrimų vadovė Isa Fulford netgi leido agentui užsakyti keksiukų partiją pagal jos konkrečias instrukcijas – užduotis, kuri „užtruko beveik valandą“, bet jai vis tiek buvo lengviau nei daryti tai rankiniu būdu wired.com.
  • Biuro užduotys – skaičiuoklės ir pristatymai: Galbūt svarbiausia, kad ChatGPT Agent gali kurti redaguojamus failus. Jis gali sugeneruoti Excel skaičiuoklę arba PowerPoint skaidrių rinkinį nuo nulio pagal jūsų užklausą openai.com. Pavyzdžiui, galite paprašyti išanalizuoti duomenis apie konkurentus ir sukurti skaidrių rinkinį su diagramomis, apibendrinančiomis rezultatus openai.com. Taip pat jis gali atnaujinti skaičiuokles naujais duomenimis arba paversti ekrano nuotraukų rinkinį į suformatuotą pristatymą openai.com. Išvesties failus galima atsisiųsti ir jie skirti atidaryti standartinėse biuro programose (nors OpenAI įspėja, kad skaidrių generavimo funkcija vis dar yra beta versijoje) openai.com.
  • Naudokite kūrėjų įrankius ir API: Viduje agentas turi prieigą prie programavimo terminalo ir gali kviesti viešas API. Tai reiškia, kad jis gali vykdyti kodą, atlikti individualius skaičiavimus ar užklausti išorines paslaugas. Jis gali integruotis su tokiomis programomis kaip Gmail ar GitHub per „jungtis“, gauti informaciją (su vartotojo leidimu), kurią naudoja savo atsakymuose openai.com. OpenAI teigia, kad ChatGPT Agent netgi gali pildyti internetines formas ir sąveikauti su tokiomis paslaugomis kaip Google Drive ar SharePoint, atlikdamas API užklausas wired.com.

Visas šias galimybes koordinuoja AI suteikta „virtuali naršyklė/kompiuteris“, kurioje jis dirba. Kai paskiriate užduotį, ChatGPT naršo svetainėse, spaudžia nuorodas ar mygtukus, slenka puslapius, pildo tekstinius laukus, rašo ir vykdo kodą ir t. t. – atlieka visus reikiamus veiksmus užduočiai įvykdyti openai.comtechmeme.com. Jis veikia iteratyviai ir savarankiškai, pats nuspręsdamas, kokį įrankį ar svetainę naudoti toliau. Pavyzdžiui, planuojant japonišką vakarienę, gali ieškoti receptų Google, tada atsidaryti maisto prekių svetainę ingredientų užsakymui ir galiausiai sugeneruoti pirkinių sąrašą skaičiuoklėje – visa tai agentas atliks be vartotojo įsikišimo į kiekvieną žingsnį.

Kaip veikia ChatGPT Agent?

Užkulisiuose ChatGPT Agent veikia su nauju dirbtinio intelekto modeliu, kurį OpenAI sukūrė specialiai agento užduotims, atskirai nuo pagrindinio GPT-4 modelio theverge.com. Modelis buvo apmokytas naudojant pastiprinimo mokymą, kad galėtų atlikti sudėtingas užduotis, reikalaujančias nuosekliai naudoti kelis įrankius (tokius kaip naršyklės, API ir kodas) theverge.com. Iš tiesų, OpenAI sujungė dvi ankstesnes eksperimentines sistemas – Operator (naršymo/automatizavimo įrankį) ir Deep Research (išsamios analizės įrankį) – į šį vieningą agentą. „Supratome, kad šie du produktai labai papildo vienas kitą, todėl nusprendėme sujungti komandas,“ sako Fulford wired.com. Rezultatas – agentas, kuris sujungia Operator gebėjimą naršyti internete su Deep Research informacijos sintezės įgūdžiais į vieną darbo eigą wired.com.

Įgūdžių įrankių rinkinys: ChatGPT Agent turi keletą specializuotų įrankių, kuriuos gali naudoti openai.com:

  • Vaizdinė naršyklė, skirta sąveikauti su svetainėmis per įprastą grafinę sąsają, kaip tai darytų žmogus (spaudžiant mygtukus, naršant puslapius).
  • Tekstinė naršyklė, skirta greitai siųsti HTTP užklausas ir analizuoti neapdorotą tekstą (naudinga greitesniam didelio teksto skaitymui arba kai nereikia vaizdinio atvaizdavimo) openai.com.
  • Terminalas/Konsolė, leidžianti vykdyti kodą, manipuliuoti failais ar naudoti komandinės eilutės įrankius savo izoliuotoje aplinkoje openai.com.
  • Tiesioginė API prieiga, leidžianti kviesti išorinių paslaugų API (pvz., skelbti į Google Calendar, užklausti duomenų bazės ar gauti duomenis iš internetinės paslaugos) openai.com.
  • Jungtys su vartotojo paskyromis: Vartotojai gali prijungti savo programas (pvz., el. paštą ar GitHub). Su leidimu agentas gali gauti svarbią informaciją iš jūsų el. laiškų, kalendoriaus ar kitų paskyrų, kad atliktų užduotis openai.com. Pavyzdžiui, jei reikia parengti santrauką, jis gali peržiūrėti jūsų Gmail naujausius laiškus arba per API patikrinti jūsų kalendorių, kad rastų laisvus laikus.

Šie įrankiai leidžia DI pasirinkti optimalų būdą užduočiai atlikti. Jis gali naudoti API, kad greitai patikrintų jūsų kalendoriaus užimtumą, tada pereiti prie vizualaus naršyklės režimo, kad naršytų OpenTable rezervacijos puslapį, kuriame reikia spustelėti ir elgtis kaip žmogui openai.com. Jis gali parsisiųsti failą per teksto naršyklę ar API, paleisti kodą terminale, kad jį išanalizuotų ar performatuotų, tada atidaryti rezultatus vizualioje naršyklėje ir pateikti juos jums openai.com. Visa tai vyksta agento virtualioje mašinoje, atskirai nuo jūsų tikrojo įrenginio – taigi, DI tarsi turi savo kompiuterį, kuriame vykdo jūsų nurodymus openai.com.

Vartotojo patirtis: Galutiniam vartotojui naudotis ChatGPT agentu yra paprasta. Ši funkcija prieinama per naują „Agent režimą“ ChatGPT sąsajoje tiems, kurie turi prieigą openai.com. Jūs tiesiog pradedate užklausą su užduotimi (taip pat galite įvesti pasvirąjį brūkšnį „/agent“) ir DI perima veiksmus theverge.com. Kol agentas dirba, ekrane rodoma pasakojimo juosta, kurioje žingsnis po žingsnio matote, ką agentas daro – pavyzdžiui, „Naršoma į maps.google.com… Ieškoma ‘italų restoranai šalia manęs’…“ – kad galėtumėte sekti eigą openai.com openai.com. Svarbu, kad galite pertraukti arba nukreipti agentą bet kuriuo metu: galite pristabdyti procesą, kad patikslintumėte nurodymus ar paprašytumėte pasirinkti kitą būdą, ir agentas prisitaikys užduoties metu neprarasdamas pažangos openai.com. Šis bendradarbiavimo ciklas skirtas tam, kad DI išliktų suderintas su jūsų tikslais.

Saugumo funkcijos: Kaip kontroliuojami DI veiksmai

Įgalinant dirbtinį intelektą veikti internete kyla akivaizdžių saugumo problemų, ir OpenAI pripažįsta, kad šis naujas režimas turi „daugiau rizikų nei ankstesni modeliaitheguardian.com. Siekdama jas sumažinti, OpenAI įdiegė apsaugos priemonių rinkinį ir apribojimus:

  • Naudotojo leidimas jautriems veiksmams: „Jūs visada kontroliuojate“, pabrėžia OpenAI theguardian.com. ChatGPT Agentas prašys aiškaus patvirtinimo prieš atlikdamas bet kokį veiksmą, turintį rimtų pasekmių, pavyzdžiui, perkant, siunčiant el. laišką ar rezervuojant vietą jūsų vardu theguardian.com theverge.com. Naudotojas turi patvirtinti šiuos negrįžtamus veiksmus, taip užkertant kelią DI, pavyzdžiui, impulsyviai užsakyti prekių už 1 000 $ „Amazon“ be jūsų žinios.
  • „Didelės rizikos“ turinio apribojimai (bio/chem): Atsižvelgiant į agento išplėstines galimybes, OpenAI jį priskyrė „Didelės biologinės ir cheminės rizikos“ kategorijai, nors jie turi „jokių galutinių įrodymų“, kad jis galėtų padėti sukurti biologinį ginklą theguardian.com theverge.com. Ši atsargumo priemonė (OpenAI parengties sistemos dalis) reiškia, kad veikia papildomos apsaugos priemonės. Konkrečiai, OpenAI realiuoju laiku naudoja turinio klasifikatorių kiekvienam agento užklausimui, kad patikrintų, ar jis susijęs su biologija ar chemija, ir jei taip, agento atsakymą peržiūri antrasis saugumo modelis, kad įsitikintų, jog nėra pateikiama pavojingų instrukcijų techcrunch.com techcrunch.com. Kitaip tariant, jei kas nors bandytų piktnaudžiauti agentu, pavyzdžiui, gamindamas toksišką medžiagą, sistema sukurta tam, kad tai aptiktų ir užblokuotų.
  • Apmokytas atsisakyti žalingų užduočių: Agentas buvo apmokytas atmesti tam tikras įtartinas ar kenksmingas užklausas. Pavyzdžiui, jis atsisakys, jei bus paprašyta atlikti akivaizdžiai pavojingą ar neetišką veiksmą, pavyzdžiui, atlikti banko pervedimą į nežinomą sąskaitą ar vykdyti destruktyvias komandas theguardian.com. OpenAI teigia, kad „raudonosios komandos“ ir srities ekspertai padėjo testuoti sistemą „realiomis situacijomis“, kad šie atsisakymai būtų tvirtesni openai.com.
  • Išjungta ilgalaikė atmintis: Įdomus apribojimas – ChatGPT ilgalaikė pokalbių atmintis agento režime yra išjungta techcrunch.com. Paprastai ChatGPT gali prisiminti informaciją iš ankstesnių pokalbio dalių ar ankstesnių sesijų (jei įjungta), tačiau OpenAI nerimavo, kad gudrus užpuolikas galėtų tuo pasinaudoti agento užduotyse (naudodamas vadinamuosius prompt injections), kad priverstų agentą nutekinti jautrius duomenis ar atlikti nepageidaujamus veiksmus techcrunch.com. Dėl to agentas šiuo metu veikia be būsenos, neperkelia informacijos iš ankstesnių pokalbių. OpenAI gali ateityje vėl įjungti atmintį, kai bus tikri dėl saugumo, tačiau kol kas ši „papildoma atsargumo priemonė“ padeda išvengti galimų duomenų nutekėjimų wired.com.
  • Finansiniai sandoriai – neleidžiami: OpenAI taip pat apribojo finansines operacijas kol kas. Agentas nevykdys pinigų pervedimų ar akcijų sandorių, net jei bus paprašyta theverge.com. Iš tiesų, yra saugiklis, vadinamas „Stebėjimo režimu“, kuris įsijungia, jei agentas naršo tam tikras jautrias svetaines (pvz., bankus ar prekybos platformas) – jis pristabdys savo veiklą, jei vartotojas išeis iš agento naršyklės kortelės, kad būtų išvengta slapto veikimo fone theverge.com.
  • Išsamus testavimas ir atlygio programa: OpenAI teigia, kad šis modelis turi jų „išsamiausią saugumo priemonių rinkinį iki šiol“ grėsmių modeliavime ir stebėsenoje openai.com openai.com. Jie bendradarbiavo su išoriniais biosekurumo ekspertais ir pasitelkė srities specialistus red-team agentui prieš paleidimą openai.com. Kartu su išleidimu, OpenAI taip pat paskelbė išsamią sistemos kortelę, kurioje paaiškinamos rizikos, ir siūlo klaidų paieškos atlygį, kad paskatintų išorės tyrėjus pranešti apie pažeidžiamumus openai.com openai.com.

Nepaisant šių atsargumo priemonių, OpenAI žino, kad netikėtas elgesys vis tiek gali pasireikšti, kai DI veikia laukinėje interneto aplinkoje. Įmonė teigia, kad nuolat tobulins agentą ir prireikus koreguos apsaugos priemones. Kol kas vartotojams patariama prižiūrėti agento veiksmus (sąsaja tai skatina, pasakodama kiekvieną žingsnį). „Šiame modelyje yra daugiau rizikų nei ankstesniuose modeliuose,“ pripažįsta OpenAI, todėl jie „elgiasi atsargiai ir jau dabar įgyvendina reikiamas apsaugos priemones“ theguardian.com theguardian.com.

Ankstyvieji apribojimai: greitis ir patikimumas

Neskubėkite atleisti savo žmogiškojo asistento. Ankstyvose demonstracijose ir testavime ChatGPT agentas parodė įspūdingus gebėjimus, bet ir ryškius apribojimus:

  • Lėtai ir nuosekliai: Agentui dažnai prireikia laiko užduotims atlikti. Jis gali kelias minutes spaudinėti ir naršyti, kad surinktų informaciją – gerokai ilgiau nei tiesioginis pokalbių roboto atsakymas. Vienoje demonstracijoje agentui, peržiūrinėjusiam „Google“ kalendorių ir restoranų svetaines, kad pasiūlytų vakarienės variantus, prireikė apie 10–15 minučių theguardian.com. Sudėtingos skaidrių prezentacijos kūrimas ar išsamūs tyrimai gali užtrukti dar ilgiau (OpenAI darbuotojai pažymėjo, kad skaidrių užduotis testavimo metu užtruko apie 25 minutes) wired.com. „Net jei tai užtrunka 15 minučių ar pusvalandį, tai vis tiek gana didelis pagreitėjimas, palyginti su tuo, kiek laiko tai užtruktų jums patiems,“ teigia Fulfordas, pabrėždamas, kad vartotojai gali pradėti užduotį ir tuo metu užsiimti kitais reikalais, kol agentas dirba theverge.com. Vis dėlto reikia kantrybės – agentas neveikia akimirksniu. OpenAI atstovas Yash Kumaras vertina, kad vidutinė užduotis trunka apie 10–15 minučių dabartinėje versijoje wired.com.
  • Kartais pasitaiko nesklandumų: Kaip ir bet kuris DI, agentas gali suklysti arba „užstrigti“ ties užduotimi. Ankstyvieji naudotojai pranešė apie įvairius rezultatus. Kai kurios sudėtingos darbo eigos gali jį supainioti, arba jis gali neteisingai interpretuoti instrukciją proceso viduryje. Vienas ankstyvas testuotojas komentavo, kad agentas „neįvykdė nė vienos iš trijų mano duotų užduočių… Graži ateities užuomina, bet kol kas praktiškai nenaudinga.“techmeme.com. Tai pabrėžia, kad technologija, nors ir pažangi, nėra neklystanti. Pati OpenAI pažymi, kad agentas „vis dar ankstyvoje stadijoje“ ir „vis dar gali daryti klaidų.“ openai.com Tikimasi, kad būsimi atnaujinimai pagerins jo patikimumą ir gebėjimą samprotauti.
  • Pagrindinė išvesties kokybė: „PowerPoint“/skaidrių generavimo funkcija šiuo metu yra beta, tai reiškia, kad sukurtos skaidrės gali atrodyti gana paprastos arba reikalauti papildomo apdorojimo openai.com. OpenAI pirmiausia susitelkė į turinio ir struktūros teisingumą, o ne į įspūdingą dizainą. Jie įspėja, kad formatavimas gali būti elementarus ir kartais gali būti neatitikimų tarp skaidrių peržiūros ir eksportuoto PowerPoint failo openai.com. Panašiai, nors agentas gali redaguoti skaičiuokles ir išlaikyti formules, jis dar nėra Excel meistras žmogaus lygmeniu. OpenAI jau treniruoja kitą versiją, kad pateiktų daugiau „išbaigtų, sudėtingų rezultatų“ pristatymuose openai.com.
  • Nėra Europos paleidimo (kol kas): Pastebėtina, kad ChatGPT agentas nebuvo paleistas ES. OpenAI „vis dar dirba, kad suteiktų prieigą Europos ekonominei erdvei ir Šveicarijai“ openai.com. Kitų šalių (įskaitant JAV ir JK) vartotojai gavo prieigą iš karto, tačiau Europos vartotojai lieka laukti neribotą laiką. OpenAI nepateikė tikslaus ES paleidimo grafiko theverge.com. Tai tikriausiai susiję su reguliavimo klausimais – griežti ES duomenų ir dirbtinio intelekto reikalavimai gali reikalauti papildomų atitikties žingsnių iš OpenAI prieš paleidžiant autonominį agentą. Kol kas europiečiai mato tik pranešimą, kad ši funkcija jų regione nepasiekiama.
Teigiama pusė yra ta, kad OpenAI teigia, jog naujojo agento pagrindinis modelis yra gerokai pajėgesnis nei ankstesnės versijos, o tai žada geresnį sudėtingumo valdymą. Pranešama, kad modelis pasiekė pačius geriausius rezultatus keliuose sudėtinguose etalonuose techcrunch.com. Pavyzdžiui, jis surinko 41,6 % „Paskutiniame žmonijos egzamine“, kuris apima daugiau nei 100 temų – tai maždaug dvigubai daugiau nei ankstesni OpenAI modeliai tame pačiame teste techcrunch.com. Ypač sudėtingame matematikos etalone (FrontierMath) jis pasiekė 27,4 % tikslumą naudodamas įrankius, kai ankstesnis geriausias modelis pasiekė tik 6,3 % techcrunch.com. Šie patobulinimai rodo, kad agentas daug geriau sprendžia sudėtingas, kelių žingsnių užduotis, kai gali naudotis įrankiais. „OpenAI sako, kad ChatGPT agentas yra daug pajėgesnis nei ankstesni pasiūlymai“, praneša TechCrunch techcrunch.com – tačiau kol daugiau naudotojų neišbandys jo realiose situacijose, dar neaišku, kiek jis iš tikrųjų „pajėgus“ už kontroliuojamų testų ribų techcrunch.com.

Prieinamumas: kas gali naudotis ChatGPT agentu?

Iš pradžių OpenAI ChatGPT agentą pristato tik kaip privilegiją mokantiems prenumeratoriams. Šią savaitę funkcija įjungiama ChatGPT Pro, Plus ir Team planų naudotojams (tai atitinka aukščiausios klasės prenumeratas) techcrunch.com. Pro naudotojai turėjo gauti prieigą pirmieji (paleidimo dieną), o Plus ir Team prenumeratoriai – per kelias artimiausias dienas openai.com. Enterprise ir Education planų klientai ją gaus „artimiausiomis savaitėmis“, kai bus išspręstos visos problemos openai.com theverge.com. Nėra paskelbto termino nemokamiems naudotojams gauti agento galimybes – ir tikėtina, kad tai liks mokama funkcija artimiausioje ateityje, atsižvelgiant į pridėtinę vertę ir dideles skaičiavimo sąnaudas.

Kartu su pakopine prieiga, OpenAI įvedė mėnesinius naudojimo limitus. Pro prenumeratoriai (aukščiausias lygis) gali vykdyti iki 400 agento užduočių per mėnesį, o Plus ir Team vartotojai gauna 40 užduočių per mėnesį įskaičiuota wired.com wired.com. Šis limitas užtikrina, kad brangios operacijos nebūtų nekontroliuojamos, tačiau papildomą naudojimą galima įsigyti per kreditų sistemą, jei vartotojams reikia daugiau openai.com. Užduotys skaičiuojamos pagal „agentinį užklausimą“, tai reiškia, kad kiekvieną kartą aktyvuojant agentą kažkam atlikti, skaičiuojama kaip viena užduotis.

Kaip minėta, Europos vartotojai negali pasiekti ChatGPT Agent paleidimo metu theguardian.com. Kai ne ES vartotojai įjungia agento režimą, jie įspėjami apie eksperimentinį funkcijos pobūdį ir gali tęsti. ES vartotojai, tačiau, yra tiesiog blokuojami. OpenAI pastaba, kad dirbama su EEE prieiga, rodo, jog vėlavimo priežastis greičiausiai yra atitiktis ES reglamentams (galbūt susijusiems su privatumu ir AI aktu). Toks geografiškai ribotas paleidimas primena, kaip kai kurios ankstesnės ChatGPT funkcijos (pvz., naršymas internete) buvo laikinai neprieinamos kai kuriuose regionuose dėl teisinio neapibrėžtumo. Kol kas visi ES vartotojai turės palaukti, kol OpenAI užtikrins, kad agentas atitinka vietinius reikalavimus.

Dirbtinio intelekto agentų ginklavimosi varžybos – Google, Anthropic ir kiti

OpenAI žengimas į „agentinį“ DI vyksta platesnės pramonės tendencijos link autonominių DI asistentų fone. Iš tiesų, konkurentai taip pat ruošia savo agento tipo funkcijas:

  • Anthropic Claude: Praėjusiais metais Anthropic (Claude pokalbių roboto kūrėjas) pristatė galimybę, vadinamą „Kompiuterio naudojimas“ – iš esmės suteikdama Claude galimybę naudotis kompiuteriu kaip žmogus, pvz., naršyti svetaines ir atlikti užduotis vartotojo įrenginyje theverge.com. Vos prieš du mėnesius (2025 m. gegužę) Anthropic pristatė naujausią modelį Claude 2 (kodas Opus 4) su agentinėmis funkcijomis ir panašiai aktyvavo specialias biosaugos priemones, kad būtų išvengta piktnaudžiavimo theverge.com. Tai rodo, kad net ir mažesnės DI startuoliai suvokia tiek autonominių agentų galią, tiek rizikas.
  • Google dirbtinio intelekto plėtiniai: Google dirba ties savo generatyvinio DI (tokio kaip Bard ir Assistant) integravimu su tiesioginiais veiksmais. Jie demonstravo DI, kuris gali rašyti el. laiškų juodraščius Gmail, apibendrinti dokumentus Google Drive ir netgi valdyti naršyklę per eksperimentinį „Duet AI“ skirtą Workspace. The Guardian pažymi, kad Google neseniai pristatė panašius asistentų „agentus“, galinčius perjunginėti tarp programėlių ir atlikti vartotojų užduotis theguardian.com. Be to, vos praėjusią savaitę Google pasamdė pagrindinius darbuotojus iš startuolio (Windsurf), siekdama sustiprinti savo agentinio DI projektus theverge.com, pabrėždama konkurencinę kovą kuriant Jarvis tipo asistentus.
  • Kiti žaidėjai: Meta (Facebook) ir Amazon taip pat minėjo DI agentų ambicijas per pajamų skambučių pristatymus, rodydami, kad visi didieji technologijų žaidėjai tai mato kaip kitą didelį dalyką theverge.com. Pavyzdžiui, el. prekybos įmonės įsivaizduoja DI agentus, galinčius visiškai valdyti klientų aptarnavimo pokalbius ar pirkimo užklausas. Ankstyvame pavyzdyje fintech įmonė Klarna 2024 m. pradžioje pranešė, kad jos DI klientų aptarnavimo agentas apdorojo du trečdalius visų klientų pokalbių, atlikdamas maždaug 700 žmonių darbą theverge.com. Ši sėkmės istorija padėjo išpopuliarinti terminą „DI agentas“ verslo aplinkoje, o nuo to laiko daugelis generalinių direktorių agentinį DI įvardija kaip tikslą theverge.com.
  • Ankstesni eksperimentai: OpenAI pati anksčiau jau buvo pradėjusi dirbti su agentais. 2025 m. sausį ji išleido Operator kaip tyrimų peržiūrą, apibūdintą kaip „agentas, galintis eiti į internetą ir atlikti užduotis už jus“ theverge.com. Operator galėjo spausti ir slinkti per svetaines. Taip pat buvo Deep Research režimas, galėjęs rašyti išsamias analizes. Tačiau šie pirmtakai buvo riboto masto ir kartais nestabilūs. Kitos startuolės (pvz., Adept AI ACT-1) parodė agentus, galinčius vykdyti komandas programinėje įrangoje kaip žmogus, tačiau nė vienas dar netapo pagrindiniu produktu. Ankstyvosios AI agentų kartos sunkiai susidorojo su sudėtingomis užduotimis ir patikimumu techcrunch.com – dažnai reikėjo daug vadovavimo ranka. Technologijų vadovai piešė AI asistentų, galinčių viską, vizijas, tačiau realybė atsiliko nuo lūkesčių techcrunch.com.

Dabar su ChatGPT Agent OpenAI bando pranokti ankstesnes pastangas. Sujungdama stipriąsias puses (naršymą internete + analizę) ir naudodama GPT-4 lygio intelektą, įmonė teigia, kad agentas pagaliau artėja prie didžiosios vizijos. „Tai geriausia agento naudotojo patirtis istorijoje. VISIŠKAI BEPROTIŠKA. PRALENKITE TAI!!“ – po pristatymo parašė vienas entuziastingas naudotojastechmeme.com. Nors toks požiūris akivaizdžiai perdėtas, jis atspindi kai kurių AI bendruomenės narių susidomėjimą, kad artėjame prie „J.A.R.V.I.S.“ – Geležinio žmogaus išgalvoto AI liokajaus – realiame gyvenime theverge.com. Kol kas ChatGPT Agent ir jo analogai vis dar yra ankstyvi žingsniai link šio idealo, daugiausia atliekantys tyrimus, programavimą ir pagrindines internetines užduotis, o ne tikrai atvirą autonomiją theverge.com. Tačiau konkurencinis pagreitis akivaizdus: kiekviena AI įmonė nori būti pirmoji, kuri sukurs AI asistentą, kurį žmonės iš tikrųjų naudotų kasdien.

Monetizacija: ar agentai uždirbs OpenAI pinigų?

Pristatydama ChatGPT Agent, OpenAI ne tik demonstruoja naujas technologijas – ji taip pat žvalgosi į galimus pajamų šaltinius. Įmonė stipriai subsidijavo ChatGPT kūrimą (Microsoft investavo milijardus) ir turi paversti savo itin populiarų AI į „pinigus generuojantį produktą“ wired.com. Agentai galėtų būti pagrindas šiai monetizacijai keliais būdais:

Prenumeratos papildomas pardavimas: Paprastai tariant, agento režimas yra aukščiausios klasės funkcija, kuri gali paskatinti daugiau vartotojų rinktis mokamus planus. Apribodama šią funkciją tik Plus/Pro prenumeratoriams, OpenAI padaro 20 $+ mėnesinį mokestį patrauklesnį pažengusiems vartotojams, norintiems, kad dirbtinis intelektas perimtų dalį jų darbo. Tai tiesioginis ir aiškus monetizavimo būdas: priversti daugiau žmonių mokėti už ChatGPT prieigą.Sandorių mokesčiai: OpenAI generalinis direktorius Sam Altman užsiminė apie galimybę uždirbti komisinius iš prekybos, vykdomos per jų dirbtinį intelektą. Jis svarstė, kad OpenAI galėtų „imti 2% mokestį nuo sugeneruotų pardavimų“ per savo asistento pastangas theguardian.com. Kitaip tariant, jei ChatGPT Agent padeda jums įsigyti prekę ar užsakyti viešbutį, OpenAI gali pasiimti nedidelę dalį (iš pardavėjo arba per partnerystės nuorodas). Šis modelis paverstų DI pagrįstą apsipirkimą ar rezervavimą pajamų šaltiniu. Naujausia agento demonstracija, kurioje jis nukreipia vartotoją į mažmeninės prekybos atsiskaitymus, iš karto paskatino kalbas, kad OpenAI ateityje gali integruoti tokio tipo partnerystės ar nukreipimo mokesčius theguardian.com.Rėmėjų rezultatai / reklamos: DI asistentai galėtų tapti nauja reklamos platforma. Jei agentas siūlo produktus ar restoranus, ar prekių ženklai mokės, kad būtų rekomenduojami? „Tokia reklamos ar rėmėjų vietos versija atrodo neišvengiama,“ pastebi analitikė Niamh Burns, atkreipdama dėmesį į „didėjantį spaudimą [DI įmonėms] monetizuoti savo produktus.“ theguardian.com Yra precedentas – paieškos sistemos uždirba iš reklamų, tad DI, kuris pakeičia paiešką, galėtų irgi. Tačiau OpenAI neigia, kad šiuo metu ChatGPT Agent rekomendacijose būtų naudojamas rėmėjų turinys theguardian.com. Jie teigia, kad agentas neįtraukia apmokamų produktų rodymo, ir „nėra planų to keisti.“ theguardian.com Kol kas rezultatai turėtų būti pagrįsti tik vartotojo kriterijais ir DI sprendimu. Vis dėlto, ateityje, kai asistentų ekosistema subręs, reklamos modeliams durys lieka atviros.
  • Įmonių paslaugos: OpenAI taip pat galėtų uždirbti siūlydama agentą kaip įmonių programinės įrangos sprendimų dalį. Pavyzdžiui, įmonės galėtų mokėti už ChatGPT Agent integravimą į savo vidinius įrankius arba už tai, kad jis tvarkytų klientų aptarnavimą. OpenAI jau derasi su Microsoft dėl tolesnio bendradarbiavimo, ir galima įsivaizduoti, kad pažangūs agentai bus įtraukti į Microsoft pasiūlymus (kas galėtų netiesiogiai atnešti pajamų ar palankių sąlygų OpenAI) wired.com. „įmonių naudojimo atvejai“ buvo svarbus veiksnys kuriant agentą, pasak produkto vadovo Yash Kumar wired.com, tai reiškia, kad OpenAI greičiausiai galvoja, kaip verslai galėtų išnaudoti (ir mokėti už) šią technologiją.
  • Artimiausiu metu OpenAI greičiausiai koncentruosis į agento tobulinimą ir prenumeratų didinimą. Tačiau ilgainiui, jei agentai taps tokie naudingi, kaip žadama, jie galėtų palengvinti visus sandorius ar darbo eigas – ir OpenAI tikrai sieks iš to gauti naudos. Įmonei teks balansuoti tarp vartotojų pasitikėjimo (agentas, rekomenduojantis produktus, turi atrodyti nešališkas, kad juo būtų pasitikima) ir pajamų gavimo. Kaip jie tai padarys, bus atidžiai stebima. Kaip svarstė analitikas Burns, jei agentas suranda jums produktus, „kas sudaro tą sistemą, kuri randa produktus? Ar bus komercinių sandorių, kai prekių ženklai mokės, kad juos rodytų asistentai…?“ theguardian.com. OpenAI tvirtina, kad kol kas ne, bet ekonominis paskatinimas egzistuoja.

    Ekspertų reakcijos ir perspektyvos

    ChatGPT Agent debiutas sukėlė tiek susidomėjimą, tiek atsargius komentarus iš ekspertų ir ankstyvųjų naudotojų. Ethan Mollick, Wharton profesorius, žinomas dėl eksperimentų su dirbtiniu intelektu švietime, buvo vienas iš nedaugelio, gavusių ankstyvą prieigą. Jo verdiktas buvo optimistiškas: „ChatGPT agentas, manau, yra didelis žingsnis į priekį, kad DI galėtų atlikti tikrą darbą. Net ir šiame etape jis gerai savarankiškai atlieka tyrimus ir sudaro Excel failus (su formulėmis!), PowerPoint ir pan.“techmeme.com. Mollick teigė, kad tai leido pamatyti, kaip įvairūs agento gebėjimai „susijungia“, net jei dar nėra tobulatechmeme.com. Kiti DI tyrėjai pritarė šiai nuomonei, juos sužavėjo, kaip ChatGPT Agent gali susieti užduotis ir pateikti naudingus rezultatus, kuriems anksčiau reikėjo daug rankinio darbo.

    Tuo pačiu metu pripažįstama, kad testavimas realiame pasaulyje tik prasidėjo. Kaip patikimai agentas susitvarko su netvarkingu atviru internetu, ar jis sugeba išvengti apgavysčių ar dezinformacijos naršydamas, ir kiek vidutiniams vartotojams jis iš tiesų yra naudingas – tai atviri klausimai. „Dar reikia pamatyti, kiek jis iš tikrųjų pajėgus realiame pasaulyje“, pažymėjo TechCrunch, atsižvelgiant į tai, kad ankstesni agentai buvo trapūs susidūrę su netikėtomis situacijomis techcrunch.com. Taip pat kyla platesnis visuomeninis susirūpinimas dėl didesnių AI galimybių: net ir su leidimų patikromis, tikrai pasirodys istorijų apie keistus ar rizikingus AI sprendimus. Pačios OpenAI sistemos kortelėje pripažįstama, kad „naujos rizikos“ kyla su tokia autonomija ir žadama nuolat vykdyti tyrimus, siekiant jas sumažinti openai.com openai.com.

    Šiuo metu ChatGPT Agent pristatymas žymi svarbų etapą AI kelyje nuo vien teksto generavimo prie realių užduočių vykdymo. Tai yra paradigmos pokytis nuo „pokalbių robotų“ prie „agentų“ – AI sistemų, kurios gali imtis iniciatyvos ir įgyvendinti tikslus skaitmeniniame pasaulyje, o ne tik bendrauti. „Agentas šiuo metu yra madingiausias žodis,“ rašo WIRED, būtent todėl, kad tiek daug įmonių siekia šios vizijos wired.com. OpenAI tvirtai įžengė į šią naują teritoriją, pasinaudodama ChatGPT populiarumu ir žinomumu, kad pristatytų agentą masėms (ar bent jau mokantiems vartotojams).

    Esmė: Jei esate tinkamas ChatGPT vartotojas, dabar galite perduoti tam tikras nuobodžias ar sudėtingas užduotis AI pagalbininkui ir stebėti, kaip jis jas atlieka žingsnis po žingsnio. Tai gali atrodyti šiek tiek magiška – tarsi turėtumėte stropų praktikantą, kuris niekada nemiega – ir kartu šiek tiek neramu matyti, kaip AI savarankiškai naršo internete. Šis pristatymas yra didelio eksperimento pradžia, kaip kasdieniai žmonės galėtų naudoti AI agentus. Kaip pasakė vienas ankstyvas naudotojas: „[Jis] gerai atlieka užduotis savarankiškai… Tai leidžia pajusti, kaip agentai susilieja į visumą.“techmeme.com Artimiausiais mėnesiais pamatysime, ar ChatGPT Agent iš tikrųjų pateisina patogumo ir produktyvumo pažadą, ir kaip jis konkuruos su vis gausėjančiu AI asistentų lauku. Vienas dalykas aiškus: AI era, kai jis veikia, o ne tik kalba, oficialiai prasidėjo.

    Šaltiniai:

    Tags: , ,