OpenAI laiž klajā ChatGPT aģentu – mākslīgā intelekta asistentu, kas var plānot, iepirkties un veidot PowerPoint prezentācijas jūsu vietā

ChatGPT attīstās no tērzēšanas robota par personīgo asistentu

OpenAI ir izlaidis lielu ChatGPT atjauninājumu, pārvēršot populāro tērzēšanas robotu par personīgo mākslīgā intelekta asistentu, kas spēj ne tikai atbildēt uz jautājumiem, bet arī veikt darbības lietotāja vārdā. Jaunā funkcija, kas nosaukta par ChatGPT “Aģentu”, tika palaista ceturtdien un ļauj ChatGPT “domāt” un rīkoties ar savu virtuālo datoru theguardian.com. Praktiski tas nozīmē, ka lietotāji tagad var lūgt ChatGPT veikt vairāku soļu uzdevumus – sākot no restorānu rezervāciju atrašanas vai iepirkšanās tiešsaistē līdz pat veselu izklājlapu un prezentāciju slaidu ģenerēšanai autonomi theguardian.com. OpenAI norāda, ka šis aģenta režīms ļauj MI pārlūkot tīmekļa vietnes, kontrolēt pārlūkprogrammas un lietotnes, pārvaldīt failus un izveidot tādus rezultātus kā Excel faili vai PowerPoint slaidi, nevis tikai sniegt teksta atbildestechmeme.com.

Kāpēc tas ir svarīgi: Šis atjauninājums ir līdz šim drosmīgākais OpenAI solis, lai pārietu no statiska jautājumu un atbilžu tērzēšanas robota uz MI, kas darbojas kā digitālais asistents vai “aģents”. Atšķirībā no standarta tērzēšanas robotiem, MI aģenti var veikt sarežģītas, vairāku soļu darbplūsmas, mijiedarbojoties ar programmatūru un tīmekļa vietnēm lietotāja vārdā theverge.com. “Cerība ir, ka aģenti spēs sniegt lietotājiem reālu lietderību – patiešām darīt lietas viņu vietā, nevis tikai izvadīt glītu tekstu un izklausīties iespaidīgi,” norāda Niamh Burns, vecākā mediju analītiķe Enders Analysis theguardian.com. Būtībā ChatGPT jaunais aģenta režīms cenšas piepildīt šo solījumu, veicot reālu darbu tiešsaistē lietotāju vietā, ne tikai tērzējot.

OpenAI ChatGPT Aģents izmanto iebūvētu “virtuālo datoru”, lai pārlūkotu tīmekli, aizpildītu veidlapas, palaistu kodu un pat izveidotu Excel izklājlapas vai PowerPoint prezentācijas lietotāja vārdā openai.com techmeme.com.

Ko spēj jaunais ChatGPT Aģents?

OpenAI raksturo ChatGPT aģentu kā vispārējas nozīmes digitālo asistentu, kas var tikt galā ar visdažādākajiem ar datoru saistītiem uzdevumiem techcrunch.com. Daži piemēri, ko tas spēj paveikt, ir:

Grafiku un plānu pārvaldība: Pārbaudiet savu kalendāru un saņemiet informāciju par gaidāmajām tikšanām vai atrodiet vakaru, kad esat brīvs, un tad meklējiet restorānu rezervācijas OpenTable openai.com theverge.com. Tas var plānot pasākumus, piemēram, randiņu vakaru, salīdzinot jūsu grafiku ar restorānu pieejamību.
Tiešsaistes izpēte un atskaites: Veiciet padziļinātu tīmekļa izpēti par kādu tēmu un sagatavojiet konspektīvu atskaiti vai analīzi. Piemēram, tas var analizēt tendences (piemēram, “Beanie Babies vs. Labubus pieaugums”) un ģenerēt kopsavilkumu vai detalizētu pētījuma darbu theverge.com.
Iepirkšanās un pasūtījumi: Aģents var veikt iepirkšanos tiešsaistē jūsu vietā. Jūs varat lūgt tam atrast produktus pēc noteiktiem kritērijiem, salīdzināt iespējas un pat veikt pasūtījumus (ar jūsu atļauju) theguardian.com wired.com. OpenAI pētniecības vadītāja Isa Fulford pat lika aģentam pasūtīt partiju kēksiņu, sekojot viņas konkrētajām instrukcijām – uzdevums, kas “aizņēma gandrīz stundu”, bet viņai joprojām bija vieglāk to izdarīt šādi, nekā darot to manuāli wired.com.
Biroja uzdevumi – izklājlapas un prezentācijas: Varbūt visspilgtāk ChatGPT aģents spēj izveidot rediģējamus failus. Tas var ģenerēt Excel izklājlapu vai PowerPoint prezentāciju no nulles, balstoties uz jūsu pieprasījumu openai.com. Piemēram, jūs varat lūgt to analizēt datus par jūsu konkurentiem un izveidot prezentāciju ar diagrammām, kas apkopo secinājumus openai.com. Tas var arī atjaunināt izklājlapas ar jauniem datiem vai pārvērst ekrānuzņēmumu kopu formatētā prezentācijā openai.com. Iegūtie faili ir lejupielādējami un paredzēti atvēršanai standarta biroja programmās (OpenAI gan brīdina, ka prezentāciju ģenerēšanas funkcija vēl ir beta versijā) openai.com.
Izmantojiet izstrādātāju rīkus un API: Sistēmas pamatā aģentam ir piekļuve programmēšanas terminālim un tas var izsaukt publiskos API. Tas nozīmē, ka tas var palaist kodu, lai veiktu pielāgotus aprēķinus vai vaicātu ārējiem pakalpojumiem. Tas var integrēties ar tādām lietotnēm kā Gmail vai GitHub, izmantojot “savienotājus”, iegūstot informāciju (ar lietotāja atļauju), ko izmantot savās atbildēs openai.com. OpenAI norāda, ka ChatGPT aģents pat var aizpildīt tiešsaistes veidlapas un saskarties ar tādiem pakalpojumiem kā Google Drive vai SharePoint, veicot API izsaukumus wired.com.

Visas šīs iespējas tiek koordinētas, piešķirot mākslīgajam intelektam savu “virtuālo pārlūkprogrammu/datoru”, kurā darboties. Kad jūs piešķirat uzdevumu, ChatGPT pārlūko tīmekļa vietnes, klikšķina uz saitēm vai pogām, ritina lapas, aizpilda teksta laukus, raksta un izpilda kodu utt. – veic visas nepieciešamās darbības, lai pabeigtu uzdevumu openai.com techmeme.com. Tas darbojas iteratīvi un autonomi, pats izlemjot, kuru rīku vai vietni izmantot nākamo. Piemēram, plānojot japāņu vakariņas, tas varētu meklēt receptes Google, pēc tam atvērt pārtikas veikala vietni, lai pasūtītu sastāvdaļas, un visbeidzot izveidot iepirkumu saraksta izklājlapu – visu to paveic aģents bez lietotāja tiešas iesaistes katrā solī.

Kā darbojas ChatGPT aģents?

Aizkulisēs ChatGPT aģentu darbina jauns mākslīgā intelekta modelis, ko OpenAI izstrādāja īpaši aģentu uzdevumiem, atsevišķi no bāzes GPT-4 modeļa theverge.com. Modelis tika apmācīts ar pastiprinātas mācīšanās palīdzību, lai risinātu sarežģītus uzdevumus, kuriem nepieciešama vairāku rīku (piemēram, pārlūkprogrammu, API un koda) izmantošana secīgi theverge.com. Patiesībā OpenAI apvienoja divas agrākas eksperimentālas sistēmas – Operator (pārlūkošanas/automatizācijas rīks) un Deep Research (padziļinātas analīzes rīks) – šajā vienotajā aģentā. “Mēs sapratām, ka abi produkti ir ļoti papildinoši, un būtībā nolēmām apvienot komandas,” saka Fulford wired.com. Rezultāts ir aģents, kas apvieno Operator spēju klikšķināt tīmeklī ar Deep Research prasmi sintezēt informāciju vienā darba plūsmā wired.com.

Prasmju rīkkaste: ChatGPT aģents ir aprīkots ar vairākiem specializētiem rīkiem, kurus tas var izmantot openai.com:

Vizuālais pārlūks, lai mijiedarbotos ar vietnēm caur parastu grafisko saskarni, kā to darītu cilvēks (spiežot pogas, pārvietojoties pa lapām).
Teksta pārlūks, lai sūtītu ātrus HTTP pieprasījumus un parsētu neapstrādātu tekstu (noderīgi, lai ātrāk lasītu lielus tekstus vai kad vizuāla attēlošana nav nepieciešama) openai.com.
Terminālis/Konsole, kas ļauj tam palaist kodu, manipulēt ar failiem vai izmantot komandrindas utilītprogrammas savā izolētajā vidē openai.com.
Tieša API piekļuve, kas ļauj tam izsaukt ārējo servisu API (piemēram, publicēt Google Kalendārā, vaicāt datubāzei vai iegūt datus no tiešsaistes servisa) openai.com.
Savienotāji ar lietotāju kontiem: Lietotāji var savienot savas lietotnes (piemēram, e-pastu vai GitHub). Ar atļauju aģents var iegūt atbilstošu informāciju no jūsu e-pastiem, kalendāra vai citiem kontiem, lai izpildītu uzdevumus openai.com. Piemēram, ja nepieciešams izveidot kopsavilkumu, tas var pārskatīt jūsu Gmail jaunākos ziņojumus vai pārbaudīt jūsu kalendāru, izmantojot API, lai atrastu brīvus laikus.

Šie rīki ļauj AI izvēlēties optimālāko pieeju uzdevumam. Tas var izmantot API, lai ātri pārbaudītu jūsu kalendāra pieejamību, pēc tam pārslēgties uz vizuālo pārlūku, lai pārvietotos pa OpenTable rezervācijas lapu, kur nepieciešama klikšķināšana un cilvēkam līdzīga mijiedarbība openai.com. Tas var lejupielādēt failu, izmantojot teksta pārlūku vai API, palaist kodu terminālī, lai to analizētu vai pārformatētu, pēc tam atvērt rezultātus vizuālajā pārlūkā, lai tos jums parādītu openai.com. Tas viss notiek aģenta virtuālajā mašīnā, izolēti no jūsu faktiskās ierīces – tātad tas ir tā, it kā AI būtu savs dators, kurā tas izpilda jūsu norādījumus openai.com.

Lietotāja pieredze: Gala lietotājam ChatGPT aģenta izmantošana ir vienkārša. Šī funkcija ir pieejama ar jaunu “Aģenta režīmu” ChatGPT saskarnē tiem, kam ir piekļuve openai.com. Jūs vienkārši sākat uzvedni ar uzdevumu (varat arī ierakstīt slīpsvītras komandu “/agent”), un AI pārņem tālāk theverge.com. Darbības laikā ekrānā tiek rādīts stāstījums par to, ko aģents dara soli pa solim – piemēram, “Pārlūko maps.google.com… Meklē ‘itāļu restorānus man tuvumā’…” – lai jūs varētu sekot līdzi openai.com openai.com. Būtiski, ka jūs varat pārtraukt vai vadīt aģentu jebkurā brīdī: varat apturēt procesu, lai precizētu savas instrukcijas vai lūgtu to mainīt pieeju, un tas pielāgosies uzdevuma vidū, nezaudējot progresu openai.com. Šī sadarbības cilpa ir paredzēta, lai AI būtu saskaņots ar jūsu mērķiem.

Drošības funkcijas: AI darbību kontrole

Pilnvarot mākslīgo intelektu veikt darbības tiešsaistē rada acīmredzamas drošības bažas, un OpenAI atzīst, ka šis jaunais režīms nāk ar “lielākiem riskiem nekā iepriekšējie modeļi” theguardian.com. Lai to mazinātu, OpenAI ir ieviesis vairākus drošības pasākumus un ierobežojumus:

Lietotāja atļauja sensitīvām darbībām: “Jūs vienmēr kontrolējat,” uzsver OpenAI theguardian.com. ChatGPT aģents pieprasīs skaidru apstiprinājumu pirms jebkādu nopietnu seku izraisošu darbību veikšanas, piemēram, pirkuma veikšanas, e-pasta nosūtīšanas vai rezervācijas veikšanas jūsu vārdā theguardian.com theverge.com. Lietotājam šie neatgriezeniskie soļi ir jāapstiprina, tādējādi novēršot, piemēram, situāciju, kur mākslīgais intelekts impulsīvi pasūta preces $1,000 vērtībā Amazon bez jūsu ziņas.
“Augsta riska” satura ierobežojumi (bio/ķīmija): Ņemot vērā aģenta paplašinātās iespējas, OpenAI to ir klasificējis kā “augsta bioloģiskā un ķīmiskā riska” kategorijā, lai gan viņiem ir “nav pārliecinošu pierādījumu”, ka tas varētu palīdzēt radīt bioloģisko ieroci theguardian.com theverge.com. Šis piesardzības pasākums (daļa no OpenAI sagatavotības sistēmas) nozīmē, ka papildu drošības barjeras ir aktīvas. Konkrēti, OpenAI reāllaikā izmanto satura klasifikatoru katram aģenta pieprasījumam, lai pārbaudītu, vai tas ir saistīts ar bioloģiju vai ķīmiju, un, ja tā ir, aģenta atbilde tiek pārbaudīta ar otru drošības modeli, lai pārliecinātos, ka tā nesniedz bīstamas instrukcijas techcrunch.com techcrunch.com. Citiem vārdiem sakot, ja kāds mēģinātu ļaunprātīgi izmantot aģentu, piemēram, lai izgatavotu toksisku vielu, sistēma ir izstrādāta, lai to atklātu un bloķētu.
Apmācīts atteikt kaitīgus uzdevumus: Aģents ir apmācīts atteikt noteiktus aizdomīgus vai ļaunprātīgus pieprasījumus. Piemēram, tas atteiksies, ja tiks lūgts veikt acīmredzami bīstamas vai neētiskas darbības, piemēram, veikt bankas pārskaitījumu uz nezināmu kontu vai izpildīt iznīcinošas komandas theguardian.com. OpenAI norāda, ka red-team speciālisti un nozares eksperti palīdzēja testēt sistēmu “reālistiskos scenārijos”, lai uzlabotu šīs atteikšanas spējas openai.com.
Atspējota ilgtermiņa atmiņa: Interesants ierobežojums – ChatGPT ilgtermiņa sarunu atmiņa aģenta režīmā ir izslēgta techcrunch.com. Parasti ChatGPT var atcerēties informāciju no iepriekšējām sarunas daļām vai iepriekšējām sesijām (ja tas ir ieslēgts), taču OpenAI baidījās, ka viltīgs uzbrucējs varētu to izmantot aģenta uzdevumu laikā (izmantojot tā sauktās prompt injections), lai liktu aģentam nopludināt sensitīvus datus vai veikt nevēlamas darbības techcrunch.com. Rezultātā aģents pašlaik darbojas bez stāvokļa, nepārsūtot informāciju no iepriekšējām sarunām. OpenAI nākotnē varētu atkal ieslēgt atmiņu, kad būs pārliecināti par drošību, bet pagaidām šis “papildu piesardzības pasākums” novērš iespējamas datu noplūdes wired.com.
Finanšu darījumi nav atļauti: OpenAI arī ierobežoja finanšu operācijas pagaidām. Piemēram, aģents neveiks naudas pārskaitījumus vai akciju tirdzniecību, pat ja to lūgs theverge.com. Patiesībā ir ieviests drošības mehānisms ar nosaukumu “Watch Mode”, kas ieslēdzas, ja aģents pārlūko noteiktas sensitīvas vietnes (piemēram, bankas vai tirdzniecības platformas) – tas apturēs savu darbību, ja lietotājs pametīs aģenta pārlūkprogrammas cilni, lai novērstu jebkādas slepenas darbības fonā theverge.com.
Plaša testēšana un atlīdzības programma: OpenAI norāda, ka šim modelim ir viņu “visaptverošākais drošības mehānisms līdz šim” attiecībā uz draudu modelēšanu un uzraudzību openai.com openai.com. Viņi sadarbojās ar ārējiem bioaizsardzības ekspertiem un pirms palaišanas piesaistīja nozares speciālistus, lai red-team aģentu openai.com. Vienlaikus ar izlaišanu OpenAI publicēja arī detalizētu sistēmas karti, kurā skaidro riskus, un piedāvā kļūdu atlīdzību, lai veicinātu ārējo pētnieku ziņošanu par ievainojamībām openai.com openai.com.

Neskatoties uz šiem piesardzības pasākumiem, OpenAI apzinās, ka, AI darbojoties reālajā interneta vidē, var rasties neparedzēta uzvedība. Uzņēmums norāda, ka pakāpeniski pilnveidos aģentu un pielāgos drošības pasākumus pēc nepieciešamības. Pašlaik lietotājiem ieteicams uzraudzīt aģenta darbības (interfeiss to veicina, aprakstot katru soli). “Ar šo modeli ir vairāk risku nekā ar iepriekšējiem modeļiem,” atzīst OpenAI, tāpēc viņi “šobrīd ievēro piesardzību un ievieš nepieciešamos drošības pasākumus” theguardian.com theguardian.com.

Agrīnie ierobežojumi: ātrums un uzticamība

Neatlaižiet savu cilvēku asistentu vēl. Sākotnējās demonstrācijās un testos ChatGPT aģents ir uzrādījis iespaidīgas spējas, bet arī būtiskus ierobežojumus:

Lēni un stabili: Aģentam bieži nepieciešams ilgāks laiks, lai pabeigtu uzdevumus. Tas var pavadīt vairākas minūtes, klikšķinot un pārlūkojot, lai savāktu informāciju, daudz ilgāk nekā tieša čatbota atbilde. Vienā demonstrācijā aģentam, pārskatot Google kalendāru un restorānu vietnes, lai ieteiktu vakariņu iespējas, tas aizņēma apmēram 10–15 minūtes theguardian.com. Sarežģītas prezentācijas izveide vai plaša pētījuma veikšana var aizņemt vēl ilgāku laiku (OpenAI darbinieki norādīja, ka prezentācijas uzdevums testēšanā aizņēma ~25 minūtes) wired.com. “Pat ja tas aizņem 15 minūtes, pusstundu, tas joprojām ir ievērojams paātrinājums, salīdzinot ar to, cik ilgi tas prasītu jums pašam,” apgalvo Fulford, norādot, ka lietotāji var uzsākt uzdevumu un tikmēr darīt citas lietas, kamēr aģents strādā theverge.com. Tomēr nepieciešama pacietība; aģents nav tūlītējs. OpenAI pārstāvis Jašs Kumars lēš, ka vidējais uzdevums aizņem ~10–15 minūtes pašreizējā versijā wired.com.
Gadījuma kļūmes: Tāpat kā jebkuram mākslīgajam intelektam, arī aģentam var gadīties kļūdas vai tas var “iestrēgt” uzdevumā. Agrīnie lietotāji ziņojuši par dažādiem rezultātiem. Daži sarežģīti darba plūsmas var to samulsināt, vai arī tas var nepareizi interpretēt norādījumu procesa vidū. Viens no pirmajiem testētājiem komentēja, ka aģents “neizpildīja nevienu no trim uzdevumiem, ko tam devu… Laba nākotnes ieskats, bet pagaidām nav īpaši noderīgs.”techmeme.com. Tas uzsver, ka tehnoloģija, lai arī attīstīta, ir nav neapšaubāma. Arī OpenAI norāda, ka aģents ir “vēl agrīnā stadijā” un “joprojām var pieļaut kļūdas.” openai.com Nākotnes atjauninājumi, visticamāk, uzlabos tā uzticamību un loģisko domāšanu.
Pamata izvades kvalitāte: PowerPoint/slīdu ģenerēšanas funkcija pašlaik ir beta versijā, kas nozīmē, ka izveidotās slīdes var izskatīties diezgan vienkāršas vai prasīt papildus apstrādi openai.com. OpenAI vispirms koncentrējās uz satura un struktūras pareizību, nevis uz iespaidīgu dizainu. Viņi brīdina, ka formatējums var būt primitīvs un dažkārt var būt neatbilstības starp slīdes priekšskatījumu un eksportēto PowerPoint failu openai.com. Līdzīgi, lai gan aģents var rediģēt izklājlapas un saglabāt formulas, tas vēl nav Excel meistars cilvēka līmenī. OpenAI jau apmāca nākamo versiju, lai prezentācijās radītu vairāk “pārdomātu, izsmalcinātu rezultātu” openai.com.
Nav Eiropas palaišanas (vēl): Ievērojami, ka ChatGPT aģents netika palaists ES. OpenAI “vēl strādā pie piekļuves nodrošināšanas Eiropas Ekonomikas zonai un Šveicei” openai.com. Lietotāji citur (tostarp ASV un Lielbritānijā) ieguva piekļuvi nekavējoties, bet Eiropas lietotājiem nākas gaidīt nenoteiktu laiku. OpenAI nav sniedzis konkrētu termiņu ES palaišanai theverge.com. Tas, visticamāk, ir saistīts ar normatīvajām prasībām – ES stingrie datu un mākslīgā intelekta noteikumi var prasīt papildu atbilstības soļus no OpenAI pirms autonomā aģenta palaišanas. Pašlaik eiropieši redz tikai ziņojumu, ka šī funkcija viņu reģionā nav pieejama.

Pozitīvi ir tas, ka OpenAI apgalvo, ka jaunā aģenta pamatā esošais modelis ir daudz spējīgāks nekā iepriekšējās versijas, kas liecina par labāku sarežģītības pārvaldīšanu. Tiek ziņots, ka modelis ir sasniedzis augstākos rezultātus vairākos sarežģītos etalonos techcrunch.com. Piemēram, tas ieguva 41,6% “Cilvēces pēdējā eksāmenā”, kas ir apjomīgs, eksperta līmeņa tests vairāk nekā 100 priekšmetos – aptuveni divreiz vairāk nekā OpenAI iepriekšējie modeļi šajā testā techcrunch.com. Ļoti sarežģītā matemātikas etalonā (FrontierMath) tas sasniedza 27,4% precizitāti ar rīku izmantošanu, salīdzinot ar tikai 6,3% labākajam iepriekšējam modelim techcrunch.com. Šie uzlabojumi liecina, ka aģents ir daudz labāks sarežģītu, vairāku soļu problēmu risināšanā, kad tas var izmantot rīkus. “OpenAI saka, ka ChatGPT aģents ir daudz spējīgāks nekā iepriekšējie piedāvājumi,” ziņo TechCrunch techcrunch.com – tomēr, kamēr vairāk lietotāju to nepārbaudīs reālās situācijās, vēl nav skaidrs, cik “spējīgs” tas patiesībā ir ārpus kontrolētiem testiem techcrunch.com.

Pieejamība: Kas var izmantot ChatGPT aģentu?

OpenAI sākotnēji ievieš ChatGPT aģentu kā priekšrocību tikai maksas abonentiem. Šonedēļ šī funkcija tiek aktivizēta lietotājiem ar ChatGPT Pro, Plus un Team plāniem (aptuveni atbilst premium līmeņiem) techcrunch.com. Pro lietotājiem piekļuve bija paredzēta vispirms (palaišanas dienā), kam sekos Plus un Team abonenti nākamo pāris dienu laikā openai.com. Uzņēmumu un izglītības plānu klienti to saņems “tuvāko nedēļu laikā”, kad tiks novērstas nepilnības openai.com theverge.com. Nav paziņots laika grafiks bezmaksas lietotājiem, kad viņi varēs izmantot aģenta iespējas – un ir iespējams, ka tā arī paliks maksas funkcija tuvākajā nākotnē, ņemot vērā pievienoto vērtību un augstās skaitļošanas izmaksas.

Kopā ar piekļuvi pa līmeņiem, OpenAI ir noteicis ikmēneša lietošanas ierobežojumus. Pro abonenti (augstākais līmenis) var palaist līdz pat 400 aģenta uzdevumiem mēnesī, kamēr Plus un Team lietotāji saņem 40 uzdevumus mēnesī iekļauts wired.com wired.com. Šis ierobežojums nodrošina, ka dārgās operācijas netiek pārmērīgi izmantotas, taču papildu lietošana var būt pieejama iegādei ar kredītu sistēmas starpniecību, ja lietotājiem nepieciešams vairāk openai.com. Uzdevumi tiek skaitīti par katru “aģentisko uzvedni”, tas nozīmē, ka katra reize, kad aktivizējat aģentu, lai kaut ko paveiktu, tiek skaitīta kā viens uzdevums.

Kā minēts, Eiropas lietotāji nevar piekļūt ChatGPT Agent palaišanas brīdī theguardian.com. Kad lietotāji ārpus ES ieslēdz aģenta režīmu, viņi tiek brīdināti par funkcijas eksperimentālo raksturu un var turpināt. ES lietotājiem, savukārt, piekļuve tiek liegta. OpenAI norāda, ka strādā pie EEA piekļuves, kas liecina, ka aizkavēšanās, visticamāk, ir saistīta ar atbilstību ES regulām (iespējams, saistībā ar privātumu un AI aktu). Šāda ģeogrāfiski ierobežota palaišana atgādina, kā dažas iepriekšējās ChatGPT funkcijas (piemēram, pārlūkošana internetā) uz laiku tika ierobežotas reģionos juridiskas nenoteiktības dēļ. Pašlaik ikvienam ES būs jāgaida, līdz OpenAI nodrošinās, ka aģents atbilst vietējām prasībām.

Mākslīgā intelekta aģentu bruņošanās sacensības – Google, Anthropic & citi

OpenAI virzība uz “aģentisko” mākslīgo intelektu notiek plašākas nozares tendences ietvaros autonomu AI asistentu virzienā. Patiesībā konkurenti ir sākuši attīstīt savas aģentam līdzīgās funkcijas:

Anthropic Claude: Pagājušajā gadā Anthropic (Claude tērzēšanas robota izstrādātājs) ieviesa iespēju ar nosaukumu “Computer Use” – būtībā dodot Claude iespēju lietot datoru kā cilvēkam, piemēram, pārlūkot tīmekli un veikt uzdevumus lietotāja datorā theverge.com. Tikai pirms diviem mēnešiem (2025. gada maijā) Anthropic izlaida savu jaunāko modeli Claude 2 (kodvārds Opus 4) ar aģentiskām funkcijām un līdzīgi aktivizēja īpašus bio-drošības pasākumus, lai novērstu ļaunprātīgu izmantošanu theverge.com. Tas parāda, ka pat mazāki AI jaunuzņēmumi apzinās gan autonomo aģentu spēku, gan riskus.
Google mākslīgā intelekta paplašinājumi: Google strādā pie tā, lai integrētu savu ģeneratīvo mākslīgo intelektu (piemēram, Bard un Assistant) ar tiešām darbībām. Viņi ir demonstrējuši mākslīgo intelektu, kas var sastādīt e-pastus Gmail, apkopot dokumentus Google Drive un pat vadīt pārlūkprogrammu caur savu eksperimentālo “Duet AI” Workspace vidē. The Guardian norāda, ka Google nesen ir palaidis līdzīgus asistenta “aģentus”, kas var pārslēgties starp lietotnēm, lai pabeigtu lietotāja uzdevumus theguardian.com. Turklāt, tikai pagājušajā nedēļā Google pieņēma darbā galvenos darbiniekus no jaunuzņēmuma (Windsurf), lai īpaši stiprinātu savus aģentiskā mākslīgā intelekta projektus theverge.com, uzsverot konkurences sacensību, lai izveidotu Džarvisa tipa asistentus.
Citi dalībnieki: Meta (Facebook) un Amazon arī ir pieminējuši mākslīgā intelekta aģentu ambīcijas peļņas zvanu laikā, norādot, ka visi lielie tehnoloģiju uzņēmumi to uzskata par nākamo lielo lietu theverge.com. Piemēram, e-komercijas uzņēmumi iztēlojas mākslīgā intelekta aģentus, kas var pilnībā apstrādāt klientu apkalpošanas čatus vai iepirkšanās pieprasījumus. Kā spilgts agrīns piemērs, fintech uzņēmums Klarna 2024. gada sākumā ziņoja, ka tā mākslīgā intelekta klientu apkalpošanas aģents apstrādāja divas trešdaļas no visām klientu sarunām, paveicot aptuveni 700 cilvēku darbu theverge.com. Šis panākumu stāsts palīdzēja popularizēt terminu “mākslīgā intelekta aģents” korporatīvajā vidē, un kopš tā laika daudzi izpilddirektori ir sākuši izvirzīt aģentu balstītu mākslīgo intelektu kā mērķi theverge.com.
Iepriekšējie eksperimenti: Arī pati OpenAI agrāk izmēģināja aģentu izstrādi. 2025. gada janvārī tā izlaida Operator kā pētniecības priekšskatījumu, aprakstot to kā “aģentu, kas var doties tīmeklī un veikt uzdevumus jūsu vietā” theverge.com. Operator varēja klikšķināt un ritināt tīmekļa vietnes. Bija arī Deep Research režīms, kas spēja rakstīt plašas analīzes. Tomēr šie priekšteči bija ierobežoti savā darbības jomā un dažkārt nestabili. Citi jaunuzņēmumi (piemēram, Adept AI ACT-1) ir demonstrējuši aģentus, kas var izpildīt komandas programmatūrā kā cilvēks, taču neviens vēl nav kļuvis par plaši izmantotu produktu. Agrīnās AI aģentu paaudzes saskārās ar grūtībām sarežģītos uzdevumos un uzticamībā techcrunch.com – bieži prasot daudz manuālas vadības. Tehnoloģiju vadītāji zīmēja vīzijas par AI asistentiem, kas spēj visu, bet realitāte atpalika no ažiotāžas techcrunch.com.

Tagad ar ChatGPT Agent OpenAI cenšas pārspēt šos agrīnos centienus. Apvienojot stiprās puses (tīmekļa pārlūkošana + analīze) un izmantojot GPT-4 līmeņa inteliģenci, viņi apgalvo, ka beidzot ir radīts aģents, kas tuvojas lielajai vīzijai. “Šis ir labākais aģenta lietotāja interfeiss jebkad. PILNĪGI TRAKS. PĀRSPĒJIET ŠO!!” kāds sajūsmināts lietotājs rakstīja pēc palaišanastechmeme.com. Lai gan šis viedoklis ir acīmredzami pārspīlēts, tas atspoguļo sajūsmu dažās AI kopienas aprindās, ka mēs tuvojamies “J.A.R.V.I.S.” – Dzelzs vīra izdomātajam AI sulainim – īstenībā theverge.com. Pašlaik ChatGPT Agent un tā līdzīgie joprojām ir tikai pirmie soļi šī ideāla virzienā, galvenokārt veicot pētījumus, programmēšanu un vienkāršus tiešsaistes uzdevumus, nevis patiesi atvērtu autonomiju theverge.com. Taču konkurences temps ir nepārprotams: katrs AI uzņēmums vēlas būt pirmais, kas izveido AI asistentu, ko cilvēki patiešām lietos ikdienā.

Monetizācija: Vai aģenti pelnīs naudu OpenAI?

Laižot klajā ChatGPT Agent, OpenAI ne tikai demonstrē jaunas tehnoloģijas – tā arī raugās uz potenciālām ieņēmumu plūsmām. Uzņēmums ir būtiski subsidējis ChatGPT izstrādi (Microsoft ieguldījis miljardus), un tam ir jāpadara šis ārkārtīgi populārais AI par “peļņu nesošu produktu” wired.com. Aģenti varētu būt galvenais monetizācijas veids vairākos aspektos:

Abonementa pārdošana: Vienkārši sakot, aģenta režīms ir premium funkcija, kas varētu piesaistīt vairāk lietotāju maksas plāniem. Ierobežojot to tikai Plus/Pro abonentiem, OpenAI padara $20+ mēneša maksu pievilcīgāku jaudīgiem lietotājiem, kuri vēlas AI asistentu, lai atvieglotu darbu. Šī ir tieša tūlītēja monetizācija: panākt, lai vairāk cilvēku maksā par ChatGPT piekļuvi.
Transakciju maksas: OpenAI izpilddirektors Sems Altmans ir norādījis uz komisijas pelnīšanu no tirdzniecības, kas veikta ar tās AI palīdzību. Viņš izteicās, ka OpenAI varētu “iekasēt 2% maksu no radītajiem pārdošanas apjomiem” ar sava asistenta palīdzību theguardian.com. Citiem vārdiem sakot, ja ChatGPT Aģents palīdz jums iegādāties produktu vai rezervēt viesnīcu, OpenAI varētu paņemt nelielu daļu (no tirgotāja vai caur partneru saitēm). Šis modelis pārvērstu AI vadītu iepirkšanos vai rezervēšanu par ieņēmumu avotu. Nesenā aģenta demonstrācija, kurā tas palīdzēja lietotājam veikt pirkumu tiešsaistē, uzreiz izraisīja runas, ka OpenAI nākotnē varētu integrēt šādas partneru vai novirzīšanas maksas theguardian.com.
Sponsorētie rezultāti/reklāmas: AI asistenti varētu kļūt par jaunu reklāmas platformu. Ja aģents iesaka produktus vai restorānus, vai zīmoli maksās, lai tiktu ieteikti? “Kāda reklāmu vai sponsorētu izvietojumu versija šķiet neizbēgama,” norāda analītiķe Nīma Bērnsa, uzsverot “pieaugošo spiedienu [uz AI uzņēmumiem] monetizēt savus produktus.” theguardian.com Ir precedents – meklētājprogrammas pelna naudu no reklāmām, tāpēc AI, kas aizvieto meklēšanu, varētu darīt to pašu. Tomēr OpenAI noliedz jebkādu sponsorēta satura izmantošanu pašlaik ChatGPT Aģenta ieteikumos theguardian.com. Viņi norādīja, ka aģents neiekļauj apmaksātus produktu izvietojumus, un “nav plānu to mainīt.” theguardian.com Pašlaik rezultātiem vajadzētu balstīties tikai uz lietotāja kritērijiem un AI vērtējumu. Tomēr nākotnē, kad asistenta ekosistēma attīstīsies, reklāmas modeļiem durvis paliek atvērtas.
Uzņēmumu pakalpojumi: OpenAI varētu arī pelnīt, piedāvājot aģentu kā daļu no uzņēmumu programmatūras risinājumiem. Piemēram, uzņēmumi varētu maksāt par ChatGPT aģenta integrēšanu savos iekšējos rīkos vai lai tas apkalpotu klientu atbalstu. OpenAI jau ir līguma sarunās ar Microsoft par turpmāku sadarbību, un var iedomāties, ka uzlaboti aģenti tiek iekļauti Microsoft piedāvājumos (kas netieši varētu nest ieņēmumus vai labvēlīgus nosacījumus OpenAI) wired.com. “uzņēmumu lietošanas gadījumi” bija būtisks apsvērums aģenta izstrādē, norāda produktu vadītājs Jašs Kumars wired.com, kas nozīmē, ka OpenAI, visticamāk, domā par to, kā uzņēmumi var izmantot (un maksāt par) šo tehnoloģiju.

Tuvākajā laikā OpenAI, visticamāk, koncentrēsies uz aģenta pilnveidošanu un abonementu veicināšanu. Taču galu galā, ja aģenti kļūs tik noderīgi, kā solīts, tie varētu nodrošināt veselu darījumu vai darba plūsmu veikšanu – un OpenAI noteikti centīsies no tā gūt vērtību. Uzņēmumam jālīdzsvaro lietotāju uzticība (aģentam, kas iesaka produktus, ir jāšķiet neitrālam, lai tam uzticētos) ar monetizāciju. Kā tas tiks darīts, tiks rūpīgi vērots. Kā analītiķis Bērnss prātoja, ja aģents atrod jums produktus, “kas notiek šīs sistēmas produktu atrašanas procesā? Vai būs komerciāli darījumi, kur zīmoli maksā, lai tiktu izcelti asistentu darbībā…?” theguardian.com. OpenAI apgalvo, ka pagaidām tā nav, taču ekonomiskais stimuls pastāv.

Ekspertu reakcijas un nākotnes prognozes

ChatGPT aģenta debija ir radījusi gan sajūsmu, gan piesardzīgus komentārus no ekspertu un agrīno lietotāju puses. Eitans Molliks, Vortonas profesors, kurš pazīstams ar eksperimentiem ar mākslīgo intelektu izglītībā, bija daļa no nelielas grupas ar agrīnu piekļuvi. Viņa vērtējums bija pozitīvs: “ChatGPT aģents, manuprāt, ir liels solis uz priekšu, lai panāktu, ka MI veic reālu darbu. Pat šajā posmā tas labi tiek galā ar patstāvīgu pētījumu veikšanu un Excel failu (ar formulām!) un PowerPoint sagatavošanu.”techmeme.com. Molliks sacīja, ka tas sniedz ieskatu, kā dažādas aģenta spējas “apvienojas”, pat ja tas vēl nav ideālstechmeme.com. Citi MI pētnieki pauda līdzīgas domas, izsakot atzinību par to, kā ChatGPT aģents spēj sasaistīt uzdevumus un radīt lietojamus rezultātus, kas iepriekš prasīja daudz manuālu soļu.

Vienlaikus tiek atzīts, ka reālā pasaules testēšana ir tikai sākusies. Cik uzticami aģents tiek galā ar haotisko atvērto internetu, vai tas spēj izvairīties no krāpniecībām vai dezinformācijas, pārlūkojot tīmekli, un cik lielā mērā vidusmēra lietotāji to uzskata par patiesi noderīgu – tie ir atklāti jautājumi. “Vēl jānoskaidro, cik spējīgs tas patiesībā ir reālajā pasaulē,” norādīja TechCrunch, ņemot vērā, ka iepriekšējie aģenti bija trausli, saskaroties ar negaidītām situācijām techcrunch.com. Pastāv arī plašāka sabiedrības baža par lielākas rīcības brīvības piešķiršanu mākslīgajam intelektam: pat ar atļauju pārbaudēm noteikti parādīsies stāsti par dīvainiem vai riskantiem AI lēmumiem. Pašas OpenAI sistēmas karte atzīst “jaunus riskus” ar šādu autonomiju un sola turpināt pētījumus to mazināšanai openai.com openai.com.

Šobrīd ChatGPT aģenta ieviešana iezīmē pavērsiena punktu AI attīstībā no tīri palīdzošas teksta ģenerēšanas uz reālu uzdevumu izpildi. Tas ir daļa no paradigmas maiņas no “čatbotiem” uz “aģentiem” – AI sistēmām, kas spēj uzņemties iniciatīvu un sasniegt mērķus digitālajā pasaulē, ne tikai sarunāties. “Aģents šobrīd ir vispopulārākais modes vārds,” raksta WIRED, tieši tāpēc, ka tik daudzi uzņēmumi dzenas pēc šīs vīzijas wired.com. OpenAI ir stingri nostiprinājis savu pozīciju šajā jaunajā teritorijā, izmantojot ChatGPT popularitāti un atpazīstamību, lai piedāvātu aģentu plašākai sabiedrībai (vai vismaz maksājošajiem lietotājiem).

Kopsavilkums: Ja esat atbilstošs ChatGPT lietotājs, tagad varat uzticēt noteiktus garlaicīgus vai sarežģītus uzdevumus AI palīgam un vērot, kā tas tos izpilda soli pa solim. Tas var šķist nedaudz maģiski – kā rūpīgs interns, kas nekad neguļ – un vienlaikus nedaudz satraucoši, redzot, kā AI patstāvīgi pārlūko tīmekli. Šis ir liela eksperimenta sākums par to, kā ikdienas cilvēki varētu izmantot AI aģentus. Kāds no pirmajiem lietotājiem to raksturoja: “[Tas] patstāvīgi veic darbu labi… Tas dod priekšstatu, kā aģenti apvienojas.”techmeme.com Turpmākajos mēnešos redzēsim, vai ChatGPT aģents patiešām pilda solījumu par ērtību un produktivitāti, un kā tas konkurē ar arvien pieaugošo AI asistentu klāstu. Viena lieta ir skaidra: ir oficiāli sākusies AI ēra, kas rīkojas, ne tikai sarunājas.

Avoti:

Booth, R. (2025. gada 17. jūlijs). The Guardian – OpenAI laiž klajā personīgo asistentu, kas spēj kontrolēt failus un tīmekļa pārlūkprogrammas. theguardian.com theguardian.com theguardian.com theguardian.com theguardian.com
OpenAI. (2025. gada 17. jūlijs). Iepazīstinām ar ChatGPT Agent: Pāreja no pētījumiem uz darbību (Oficiālais OpenAI emuārs) openai.com openai.com openai.com openai.com
Field, H. (2025. gada 17. jūlijs). The Verge – OpenAI jaunais ChatGPT Agent var kontrolēt visu datoru un veikt uzdevumus jūsu vietā. theverge.com theverge.com theverge.com theverge.com
Zeff, M. (2025. gada 17. jūlijs). TechCrunch – OpenAI laiž klajā vispārējas nozīmes aģentu ChatGPT. techcrunch.com techcrunch.com techcrunch.com techcrunch.com
Rogers, R. (2025. gada 17. jūlijs). WIRED – OpenAI jaunais ChatGPT aģents cenšas paveikt visu. wired.com wired.com wired.com wired.com
Techmeme. (2025. gada 17. jūlijs). Apkopotas tehnoloģiju ziņas par ChatGPT aģenta palaišanu (ieskaitot Ītana Molika komentārus)techmeme.com