OpenAI wypuszcza ChatGPT Agenta – Asystenta AI, który może planować, robić zakupy i tworzyć prezentacje PowerPoint dla Ciebie

ChatGPT ewoluuje z chatbota w osobistego asystenta
OpenAI wprowadziło dużą aktualizację ChatGPT, zamieniając popularnego chatbota w osobistego asystenta AI, który nie tylko odpowiada na pytania, ale także wykonuje zadania w imieniu użytkownika. Nazwana ChatGPT „Agent”, nowa funkcja została uruchomiona w czwartek i pozwala ChatGPT „myśleć” oraz działać za pomocą własnego wirtualnego komputera theguardian.com. W praktyce użytkownicy mogą teraz poprosić ChatGPT o wykonanie złożonych zadań – od znalezienia rezerwacji w restauracji czy zakupów online po autonomiczne generowanie arkuszy kalkulacyjnych i prezentacji slajdowych theguardian.com. OpenAI twierdzi, że tryb agenta pozwala AI nawigować po stronach internetowych, kontrolować przeglądarki i aplikacje, zarządzać plikami oraz tworzyć wyjścia, takie jak pliki Excel czy slajdy PowerPoint, zamiast po prostu generować odpowiedzi tekstowetechmeme.com.
Dlaczego to ma znaczenie: Aktualizacja to najodważniejszy krok OpenAI w kierunku przejścia od statycznego chatbota Q&A do AI działającej jak cyfrowy asystent lub „agent”. W przeciwieństwie do standardowych chatbotów, agenty AI mogą realizować złożone, wieloetapowe zadania, wchodząc w interakcję z oprogramowaniem i stronami internetowymi w imieniu użytkownika theverge.com. „Mamy nadzieję, że agenci będą mogli przynieść użytkownikom prawdziwą użyteczność – będą faktycznie robić rzeczy za nich, a nie tylko generować dopracowany tekst i brzmieć imponująco,” zauważa Niamh Burns, starszy analityk mediów w Enders Analysis theguardian.com. W istocie nowy tryb agenta ChatGPT ma spełnić tę obietnicę, wykonując prawdziwą pracę online dla użytkowników, a nie tylko rozmawiając.
Agent ChatGPT firmy OpenAI używa wbudowanego „wirtualnego komputera” do przeglądania internetu, wypełniania formularzy, uruchamiania kodu, a nawet tworzenia arkuszy Excel lub prezentacji PowerPoint w imieniu użytkownika openai.comtechmeme.com.
Co potrafi nowy agent ChatGPT?
OpenAI prezentuje ChatGPT Agent jako uniwersalnego asystenta cyfrowego, który potrafi wykonywać szeroki zakres zadań komputerowych techcrunch.com. Przykłady jego możliwości to:
- Zarządzanie harmonogramem i planami: Sprawdza Twój kalendarz i informuje o nadchodzących spotkaniach lub wyszukuje wolny wieczór i sprawdza dostępność rezerwacji w restauracjach przez OpenTable openai.com theverge.com. Może zaplanować wydarzenia, takie jak wieczór randkowy, sprawdzając Twój grafik oraz dostępność miejsc w restauracjach.
- Badania online i raporty: Przeprowadza szczegółowe badania w internecie na wybrany temat i przygotowuje zwięzły raport lub analizę. Może np. analizować trendy (np. „wzrost popularności Beanie Babies vs. Labubus”) i przygotować podsumowanie lub rozbudowaną pracę badawczą theverge.com.
- Zakupy i zamówienia: Agent może dokonywać zakupów online za Ciebie. Możesz poprosić go, by wyszukał produkty spełniające określone kryteria, porównał opcje, a nawet złożył zamówienie (za Twoją zgodą) theguardian.com wired.com. Isa Fulford, szefowa zespołu badawczego OpenAI, zleciła agentowi zamówienie partii babeczek postępując według jej szczegółowych wytycznych – było to zadanie, które „zajęło prawie godzinę”, ale i tak było dla niej łatwiejsze niż wykonanie go ręcznie wired.com.
- Zadania biurowe – arkusze kalkulacyjne i prezentacje: Być może najbardziej zauważalną cechą ChatGPT Agent jest możliwość generowania edytowalnych plików. Może on wygenerować od podstaw arkusz Excel lub prezentację PowerPoint na podstawie Twojej prośby openai.com. Na przykład możesz poprosić o przeanalizowanie danych dotyczących konkurencji i stworzenie prezentacji z wykresami podsumowującymi ustalenia openai.com. Może również aktualizować arkusze kalkulacyjne o nowe dane lub przekształcić zestaw zrzutów ekranu w sformatowaną prezentację openai.com. Pliki wyjściowe można pobrać i są przeznaczone do otwarcia w standardowym oprogramowaniu biurowym (choć OpenAI zastrzega, że funkcja generowania slajdów jest nadal w fazie beta) openai.com.
- Korzystaj z narzędzi deweloperskich i API: W tle agent ma dostęp do programistycznego terminala i może korzystać z publicznych API. Oznacza to, że może uruchamiać kod, aby wykonać niestandardowe obliczenia lub zapytania do zewnętrznych usług. Może integrować się z aplikacjami takimi jak Gmail czy GitHub za pomocą „konektorów”, pobierając informacje (za zgodą użytkownika), które wykorzysta w swoich odpowiedziach openai.com. OpenAI twierdzi, że ChatGPT Agent potrafi nawet wypełniać formularze online i łączyć się z usługami typu Google Drive lub SharePoint, wykonując wywołania API wired.com.
Wszystkie te możliwości są koordynowane poprzez nadanie AI własnej „wirtualnej przeglądarki/komputera”, na którym może pracować. Po przydzieleniu zadania ChatGPT będzie nawigować po stronach internetowych, klikać linki lub przyciski, przewijać strony, wypełniać pola tekstowe, pisać i wykonywać kod oraz wykonywać inne niezbędne czynności do realizacji zadania openai.comtechmeme.com. Działa iteracyjnie i autonomicznie, samodzielnie decydując, z jakiego narzędzia lub strony internetowej skorzystać w następnej kolejności. Na przykład planowanie tej japońskiej kolacji może obejmować wyszukiwanie przepisów w Google, następnie otwarcie strony sklepu spożywczego w celu zamówienia składników i na końcu wygenerowanie arkusza z listą zakupów – wszystko wykonane przez agenta bez potrzeby nadzorowania każdego kroku przez użytkownika.
Jak działa ChatGPT Agent?
Za kulisami ChatGPT Agent jest zasilany przez nowy model AI, który OpenAI stworzył specjalnie do zadań agentowych, oddzielnie od bazowego modelu GPT-4 theverge.com. Model został wytrenowany za pomocą uczenia ze wzmocnieniem, aby radzić sobie ze złożonymi zadaniami wymagającymi użycia wielu narzędzi (takich jak przeglądarki, API i kod) w sekwencji theverge.com. W rzeczywistości OpenAI połączyło dwa wcześniejsze eksperymentalne systemy – Operator (narzędzie do przeglądania/automatyzacji) i Deep Research (narzędzie do szczegółowej analizy) – w jednego, zintegrowanego agenta. „Zauważyliśmy, że oba produkty znakomicie się uzupełniają i zdecydowaliśmy się połączyć zespoły,” mówi Fulford wired.com. Efektem jest agent, który łącze umiejętność Operatora do poruszania się po stronach internetowych ze zdolnością Deep Research do syntezy informacji w jednym przepływie pracy wired.com.
Skrzynka narzędziowa umiejętności: ChatGPT Agent jest wyposażony w wiele wyspecjalizowanych narzędzi, którymi może się posługiwać openai.com:
- Przeglądarka wizualna do interakcji ze stronami internetowymi przez normalny interfejs użytkownika, jak robi to człowiek (klikanie przycisków, nawigacja po stronach).
- Przeglądarka tekstowa do szybkiego wysyłania zapytań HTTP i analizowania surowego tekstu (przydatne do szybkiego czytania dużych ilości tekstu lub gdy niepotrzebne jest przetwarzanie wizualne) openai.com.
- Terminal/Konsola, który umożliwia uruchamianie kodu, manipulowanie plikami lub korzystanie z narzędzi konsolowych w swoim odizolowanym środowisku openai.com.
- Bezpośredni dostęp do API, pozwalający wywoływać API zewnętrznych usług (np. dodawanie wpisów do Kalendarza Google, zapytania do bazy danych czy pobieranie danych z serwisu online) openai.com.
- Konektory do kont użytkowników: Użytkownicy mogą połączyć swoje własne aplikacje (takie jak e-mail lub GitHub). Za zgodą użytkownika agent może pobierać odpowiednie informacje z Twoich e-maili, kalendarza lub innych kont, by realizować zadania openai.com. Na przykład, może przeskanować Twoją skrzynkę Gmail w poszukiwaniu ostatnich wiadomości, jeśli jest to potrzebne do przygotowania podsumowania, lub sprawdzić Twój kalendarz przez API, aby znaleźć wolne terminy.
Narzędzia te pozwalają AI wybrać optymalne podejście do realizacji zadania. Może użyć API, by szybko sprawdzić dostępność w Twoim kalendarzu, a następnie przełączyć się na przeglądarkę wizualną, aby nawigować po stronie OpenTable wymagającej kliknięć i interakcji przypominającej ludzką openai.com. Może pobrać plik przez przeglądarkę tekstową lub API, uruchomić na nim kod w terminalu, by go przeanalizować lub przeformatować, a następnie otworzyć wyniki w przeglądarce wizualnej, aby je przedstawić openai.com. Wszystko to odbywa się w maszynie wirtualnej agenta, odizolowanej od Twojego faktycznego urządzenia – to tak, jakby AI miało własny komputer, na którym wykonuje Twoje polecenia openai.com.
Doświadczenie użytkownika: Dla użytkownika końcowego korzystanie z ChatGPT Agent jest bardzo proste. Funkcja jest dostępna poprzez nowy tryb „Agent” w interfejsie ChatGPT dla osób z dostępem openai.com. Wystarczy rozpocząć prompt od podania zadania (możesz też wpisać komendę „/agent”), a AI przejmuje resztę theverge.com. W trakcie działania agent wyświetla na ekranie narrację pokazującą krok po kroku, co robi – na przykład „Przeglądanie maps.google.com… Szukanie ‘włoskie restauracje w pobliżu’…” – dzięki czemu możesz śledzić jego pracę openai.com openai.com. Co ważne, możesz przerwać lub skierować agenta w dowolnym momencie: możesz wstrzymać proces, aby doprecyzować swoje instrukcje lub poprosić o inne podejście, a agent dostosuje się w trakcie zadania bez utraty postępu openai.com. Ta współpraca ma zapewnić, że AI będzie realizować Twoje cele.
Funkcje bezpieczeństwa: Kontrolowanie działań AI
Upoważnienie AI do podejmowania działań online budzi oczywiste obawy dotyczące bezpieczeństwa i OpenAI przyznaje, że ten nowy tryb wiąże się z „większym ryzykiem niż poprzednie modele” theguardian.com. Aby temu zapobiec, OpenAI wdrożyło szereg zabezpieczeń i ograniczeń:
- Zgoda użytkownika na wrażliwe działania: „To użytkownik zawsze decyduje,” podkreśla OpenAI theguardian.com. Agent ChatGPT będzie prosił o wyraźne potwierdzenie przed wykonaniem jakiejkolwiek czynności o poważnych konsekwencjach, takich jak dokonanie zakupu, wysłanie e-maila czy rezerwacja w Twoim imieniu theguardian.com theverge.com. Użytkownik musi zaakceptować te nieodwracalne działania, co zapobiega sytuacjom, np. impulsywnemu zamówieniu sprzętu za 1000 dolarów na Amazonie bez Twojej wiedzy.
- Ograniczenia dotyczące treści „wysokiego ryzyka” (bio/chem): Biorąc pod uwagę rozszerzone możliwości agenta, OpenAI zaklasyfikowało go jako kategorię „wysokiego ryzyka biologicznego i chemicznego”, mimo że nie mają „żadnych jednoznacznych dowodów” na to, że mógłby pomóc w stworzeniu broni biologicznej theguardian.com theverge.com. Ten środek ostrożności (część ram przygotowawczych OpenAI) oznacza, że dodatkowe zabezpieczenia są aktywne. Konkretne, OpenAI uruchamia klasyfikator treści w czasie rzeczywistym dla każdego polecenia agenta, aby sprawdzić, czy dotyczy ono biologii lub chemii, a jeśli tak, odpowiedź agenta jest sprawdzana przez drugi model bezpieczeństwa, aby upewnić się, że nie przekazuje niebezpiecznych instrukcji techcrunch.com techcrunch.com. Innymi słowy, jeśli ktoś próbowałby użyć agenta np. do stworzenia niebezpiecznej substancji, system został zaprojektowany w taki sposób, by to wykryć i zablokować.
- Szkolony do odrzucania szkodliwych zadań: Agent został przeszkolony, aby odrzucać podejrzane lub złośliwe prośby. Na przykład odmówi, jeśli zostanie poproszony o wykonanie czegoś oczywiście niebezpiecznego lub nieetycznego, jak przelew bankowy na nieznane konto czy wykonywanie destrukcyjnych poleceń theguardian.com. OpenAI twierdzi, że red-teamerzy i eksperci dziedzinowi pomagali testować system w „realistycznych scenariuszach”, by wzmocnić te odmowy openai.com.
- Wyłączona pamięć długoterminowa: Ciekawym ograniczeniem jest to, że długoterminowa pamięć czatu ChatGPT jest wyłączona w trybie agenta techcrunch.com. Zwykle ChatGPT może zapamiętywać informacje z wcześniejszych rozmów lub poprzednich sesji (jeśli jest to włączone), ale OpenAI obawiało się, że sprytny atakujący mógłby to wykorzystać podczas zadań agenta (poprzez tzw. wstrzyknięcia promptów), aby nakłonić agenta do ujawnienia wrażliwych danych lub wykonania niechcianych działań techcrunch.com. W rezultacie agent obecnie działa bezstanowo i nie przenosi informacji z poprzednich rozmów. OpenAI może ponownie włączyć pamięć w przyszłości, gdy będą pewni, że jest to bezpieczne, ale na razie ten „dodatkowy środek ostrożności” zapobiega potencjalnym wyciekom danych wired.com.
- Transakcje finansowe zabronione: OpenAI również ograniczyło operacje finansowe na ten moment. Agent nie wykona przelewów pieniężnych ani transakcji giełdowych, nawet na wyraźną prośbę theverge.com. W rzeczywistości istnieje zabezpieczenie o nazwie „Tryb obserwacji”, które uruchamia się, jeśli agent przegląda niektóre wrażliwe strony internetowe (np. banki lub platformy handlowe) – wstrzyma wtedy swoje działania, jeśli użytkownik opuści kartę przeglądarki agenta, aby zapobiec potajemnym działaniom w tle theverge.com.
- Rozbudowane testy i program nagród za wykrycie błędów: OpenAI podkreśla, że ten model posiada „najbardziej kompleksowy system bezpieczeństwa, jaki dotąd stworzyli” pod względem modelowania zagrożeń i monitorowania openai.com openai.com. Współpracowali z zewnętrznymi ekspertami ds. bio-bezpieczeństwa oraz zlecili specjalistom ds. domen, aby red-teamowali agenta przed premierą openai.com. Równolegle z premierą OpenAI opublikowało również szczegółową kartę systemową wyjaśniającą ryzyka i zaoferowało nagrodę za zgłoszenie błędów, aby zachęcić zewnętrznych badaczy do zgłaszania luk w zabezpieczeniach openai.com openai.com.
Mimo tych środków ostrożności OpenAI zdaje sobie sprawę, że nieoczekiwane zachowania mogą wciąż pojawić się podczas działania AI w otwartym internecie. Firma zapowiada, że będzie stopniowo udoskonalać agenta i dostosowywać zabezpieczenia w razie potrzeby. Na ten moment użytkownikom zaleca się nadzorowanie działań agenta (interfejs do tego zachęca, opisując każdy krok). „W przypadku tego modelu istnieje więcej zagrożeń niż w poprzednich wersjach,” przyznaje OpenAI, dlatego „zachowuje ostrożność i wdraża teraz wymagane środki ochronne” theguardian.com theguardian.com.
Wczesne ograniczenia: szybkość i niezawodność
Nie zwalniaj jeszcze swojego ludzkiego asystenta. W początkowych prezentacjach i testach ChatGPT Agent wykazał imponujące możliwości, ale też zauważalne ograniczenia:
- Powoli i systematycznie: Agent często potrzebuje czasu na wykonanie zadań. Może spędzić kilka minut klikając i przeglądając strony, aby zebrać informacje, co zajmuje znacznie dłużej niż uzyskanie bezpośredniej odpowiedzi od chatbota. W jednym z demonstracji, przeszukiwanie przez agenta Kalendarza Google i stron z restauracjami w celu zasugerowania opcji na kolację zajęło około 10–15 minut theguardian.com. Generowanie złożonej prezentacji lub prowadzenie szeroko zakrojonych badań może trwać jeszcze dłużej (pracownicy OpenAI zauważyli, że zadanie z prezentacją zajęło w testach ok. 25 minut) wired.com. „Nawet jeśli to trwa 15 minut, pół godziny, to i tak ogromne przyspieszenie w porównaniu z tym, ile zajęłoby ci zrobienie tego samemu,” argumentuje Fulford, zauważając, że użytkownicy mogą rozpocząć zadanie i w tym czasie zająć się czymś innym, gdy agent pracuje theverge.com. Mimo to wymagana jest cierpliwość; agent nie działa natychmiastowo. Yash Kumar z OpenAI szacuje, że przeciętne zadanie zajmuje obecnie ok. 10–15 minut wired.com.
- Okazjonalne potknięcia: Jak w przypadku każdej AI, agent może popełniać błędy lub „zaciąć się” podczas zadania. Wczesni użytkownicy zgłaszali mieszane rezultaty. Niektóre skomplikowane scenariusze mogą go zdezorientować lub może źle zinterpretować instrukcję w trakcie działania. Jeden z pierwszych testerów stwierdził, że agent „nie poradził sobie z trzema zadaniami, które mu zleciłem… Fajny rzut oka w przyszłość, ale na razie zwykle nieprzydatny.”techmeme.com. Podkreśla to, że technologia, choć zaawansowana, nie jest nieomylna. OpenAI samo zaznacza, że agent jest „ciągle na wczesnym etapie” i „wciąż może popełniać błędy.” openai.com Oczekuje się, że przyszłe aktualizacje poprawią jego niezawodność i zdolności rozumowania.
- Podstawowa jakość wyników: Funkcja generowania prezentacji PowerPoint/slajdów jest obecnie w fazie beta, co oznacza, że tworzone slajdy mogą wyglądać dość zwyczajnie lub wymagać dopracowania openai.com. OpenAI skupiło się najpierw na poprawności treści i struktury, a nie na efektownym wyglądzie. Ostrzegają, że formatowanie może być podstawowe i czasami mogą wystąpić rozbieżności między podglądem slajdów a wyeksportowanym plikiem PowerPoint openai.com. Podobnie, choć agent potrafi edytować arkusze kalkulacyjne i utrzymywać formuły, nie jest jeszcze mistrzem Excela na poziomie doświadczonego użytkownika. OpenAI już szkoli kolejną wersję, aby generowała bardziej „dopieszczone, zaawansowane wyniki” w prezentacjach openai.com.
- Brak premiery w Europie (na razie): Co ważne, ChatGPT Agent nie został uruchomiony w UE. OpenAI „wciąż pracuje nad udostępnieniem usługi na terenie Europejskiego Obszaru Gospodarczego i Szwajcarii” openai.com. Użytkownicy w innych regionach (w tym w USA i Wielkiej Brytanii) uzyskali dostęp natychmiast, ale europejscy użytkownicy muszą czekać w nieskończoność. OpenAI nie podało konkretnego terminu wprowadzenia usługi w UE theverge.com. Jest to prawdopodobnie związane z kwestiami regulacyjnymi – rygorystyczne przepisy UE dotyczące danych i sztucznej inteligencji mogą wymagać od OpenAI dodatkowych działań związanych z zgodnością, zanim agent zostanie udostępniony. Na tę chwilę Europejczycy widzą tylko komunikat, że ta funkcja jest niedostępna w ich regionie.
Z pozytywnej strony, OpenAI twierdzi, że nowy agent oparty jest na znacznie bardziej zaawansowanym modelu niż wcześniejsze wersje, co dobrze wróży przy radzeniu sobie ze złożonością. Model ten uzyskał podobno najlepsze wyniki w swojej klasie w kilku trudnych testach techcrunch.com. Na przykład osiągnął 41,6% w teście „Ostatni Egzamin Ludzkości”, ogromnym egzaminie eksperckim obejmującym ponad 100 przedmiotów – to około dwukrotnie więcej niż wcześniejsze modele OpenAI uzyskiwały w tym teście techcrunch.com. W przypadku wyjątkowo trudnego testu z matematyki (FrontierMath) uzyskał 27,4% skuteczności z wykorzystaniem narzędzi, w porównaniu do zaledwie 6,3% najlepszego wcześniejszego modelu techcrunch.com. Te usprawnienia sugerują, że agent znacznie lepiej radzi sobie z rozwiązywaniem złożonych, wieloetapowych problemów, kiedy może korzystać z narzędzi. „OpenAI twierdzi, że agent ChatGPT jest znacznie bardziej zaawansowany niż jego wcześniejsze wersje,” donosi TechCrunch techcrunch.com – choć dopóki więcej użytkowników nie przetestuje go w rzeczywistych sytuacjach, pozostaje pytanie, jak „zaawansowany” jest on poza warunkami testowymi techcrunch.com.
Dostępność: Kto może korzystać z agenta ChatGPT?
OpenAI początkowo wprowadza ChatGPT Agent jako przywilej wyłącznie dla płatnych subskrybentów. Od tego tygodnia funkcja jest udostępniana użytkownikom w planach ChatGPT Pro, Plus i Team (odpowiednik wyższych poziomów premium) techcrunch.com. Użytkownicy Pro mieli otrzymać dostęp jako pierwsi (w dniu premiery), a następnie w ciągu kilku kolejnych dni subskrybenci Plus i Team openai.com. Klienci posiadający plany Enterprise i Education otrzymają go „w nadchodzących tygodniach”, gdy zostaną dopracowane wszelkie szczegóły openai.com theverge.com. Nie podano żadnego terminu udostępnienia agentów użytkownikom darmowym – i jest możliwe, że pozostanie to funkcja płatna w dającej się przewidzieć przyszłości, biorąc pod uwagę jej wartość dodaną i wysokie koszty obliczeniowe.
Wraz z dostępem warstwowym, OpenAI wprowadziło miesięczne limity użytkowania. Subskrybenci Pro (najwyższy próg) mogą wykonać do 400 zadań agenta miesięcznie, podczas gdy użytkownicy Plus i Team otrzymują 40 zadań miesięcznie w ramach abonamentu wired.com wired.com. Taki limit zapewnia, że kosztowne operacje nie wymkną się spod kontroli, ale dodatkowe wykorzystanie może być dostępne do zakupu poprzez system kredytowy, jeśli użytkownicy będą potrzebować więcej openai.com. Zadania są liczone za „prompt agentowy”, co oznacza, że każde uruchomienie agenta w celu wykonania czegoś liczy się jako jedno zadanie.
Jak wspomniano, użytkownicy w Europie nie mają dostępu do ChatGPT Agent na starcie theguardian.com. Gdy użytkownicy spoza UE włączają tryb agenta, wyświetlane jest ostrzeżenie o eksperymentalnym charakterze funkcji, po czym mogą kontynuować. Użytkownicy z UE są jednak po prostu blokowani. Adnotacja OpenAI o pracach nad dostępem dla EOG sugeruje, że przyczyną opóźnienia są najprawdopodobniej wymogi zgodności z przepisami UE (być może dotyczące prywatności i ustawy o AI). Takie geofencowane wdrożenie przypomina wcześniejsze przypadki, gdy niektóre funkcje ChatGPT (np. przeglądanie sieci) były tymczasowo wstrzymane na danym obszarze ze względu na niejasności prawne. Obecnie każdy w UE będzie musiał poczekać, aż OpenAI zapewni zgodność agenta z lokalnymi wymaganiami.
Wyścig zbrojeń agentów AI – Google, Anthropic i inni
Ekspansja OpenAI w kierunku „agentowego” AI wpisuje się w szerszy trend branżowy dotyczący autonomicznych asystentów AI. W rzeczywistości konkurenci również przygotowują własne funkcje przypominające agentów:
- Claude Anthropic: W zeszłym roku Anthropic (twórca chatbota Claude) wprowadził funkcję o nazwie „Computer Use” – zasadniczo umożliwiając Claude’owi korzystanie z komputera jak człowiek, np. przeglądanie stron internetowych i wykonywanie zadań na komputerze użytkownika theverge.com. Zaledwie dwa miesiące temu (maj 2025) Anthropic wypuścił swój najnowszy model Claude 2 (nazwa kodowa Opus 4) z funkcjami agentowymi i podobnie uruchomił specjalne środki bio-bezpieczeństwa, by zapobiec nadużyciom theverge.com. Pokazuje to, że nawet mniejsze startupy AI są świadome zarówno potencjału, jak i ryzyka związanego z autonomicznymi agentami.
- Rozszerzenia AI Google: Google pracuje nad integracją swojego generatywnego AI (takiego jak Bard i Assistant) z bezpośrednimi działaniami. Zaprezentowano AI, które potrafi pisać e-maile w Gmailu, podsumowywać dokumenty w Google Drive, a nawet sterować przeglądarką za pomocą eksperymentalnego „Duet AI” dla Workspace. Guardian zauważa, że Google niedawno uruchomiło podobnych asystentów „agentów”, którzy potrafią sprawnie przełączać się między aplikacjami, aby wykonać zadania użytkownika theguardian.com. Co więcej, zaledwie w zeszłym tygodniu Google zatrudniło kluczowych pracowników ze startupu (Windsurf), by wzmocnić swoje projekty agentowego AI theverge.com, co podkreśla zaciętą rywalizację o stworzenie asystentów na wzór Jarvisa.
- Inni gracze: Meta (Facebook) i Amazon również wspomniały o ambicjach dotyczących agentów AI podczas rozmów o wynikach finansowych, co wskazuje, że wszyscy giganci technologiczni postrzegają to jako kolejną wielką rzecz theverge.com. Na przykład firmy e-commerce wyobrażają sobie agentów AI, którzy mogą obsługiwać czaty z obsługą klienta lub zamówienia zakupowe od początku do końca. Uderzającym wczesnym przykładem jest fintech Klarna, który na początku 2024 roku poinformował, że jego agent obsługi klienta oparty na AI obsłużył dwie trzecie wszystkich czatów z klientami, wykonując pracę około 700 ludzi theverge.com. Ten sukces pomógł spopularyzować pojęcie „agenta AI” w środowiskach korporacyjnych, a od tego czasu wielu CEO zaczęło przedstawiać AI oparte na agentach jako cel theverge.com.
- Poprzednie eksperymenty: Sama firma OpenAI już wcześniej eksperymentowała z agentami. W styczniu 2025 roku wypuściła Operatora jako podgląd badawczy, opisując go jako „agenta, który może przeglądać internet i wykonywać zadania dla ciebie” theverge.com. Operator mógł klikać i przewijać strony internetowe. Istniał także tryb Deep Research, który potrafił pisać długie analizy. Jednak te pierwotne wersje miały ograniczony zakres i bywały zawodne. Inne startupy (jak ACT-1 od Adept AI) pokazały agentów, którzy potrafią wykonywać polecenia w oprogramowaniu jak człowiek, ale żaden z nich nie stał się jeszcze produktem masowym. Wczesne generacje agentów AI miały problemy z trudnymi zadaniami i niezawodnością techcrunch.com – często wymagały dużo wsparcia ze strony człowieka. Szefowie technologii przedstawiali wizje asystentów AI, którzy potrafią wszystko, ale rzeczywistość była daleka od tego szumu techcrunch.com.
Teraz, dzięki ChatGPT Agent, OpenAI próbuje przeskoczyć wcześniejsze próby. Łącząc mocne strony (przeglądanie internetu + analiza) i wykorzystując inteligencję na poziomie GPT-4, twierdzą, że stworzyli agenta zbliżającego się wreszcie do wielkiej wizji. „To jest najlepszy UX dla agenta w historii. ABSOLUTNIE SZALEŃSTWO. POBIJCIE TO!!” – napisał jeden z podekscytowanych użytkowników po premierzetechmeme.com. Choć ten entuzjazm jest ewidentnie przesadzony, oddaje podekscytowanie w niektórych kręgach społeczności AI, gdzie czujemy, że zbliżamy się do „J.A.R.V.I.S.-a” – fikcyjnego asystenta AI Iron Mana – w prawdziwym życiu theverge.com. Na razie ChatGPT Agent i jego konkurenci to wciąż wczesne kroki w stronę tego ideału. Są wykorzystywane głównie do researchu, kodowania i prostych zadań online, a nie do naprawdę autonomicznego działania theverge.com. Ale impet konkurencji jest wyraźny: każda firma AI chce być tą, która stworzy asystenta AI wykorzystywanego na co dzień przez ludzi.
Monetyzacja: Czy Agenci Przyniosą Zyski OpenAI?
Wraz z uruchomieniem ChatGPT Agent, OpenAI nie tylko prezentuje nową technologię – ale także szuka potencjalnych źródeł przychodów. Firma mocno dotowała rozwój ChatGPT (Microsoft zainwestował miliardy), a teraz musi zamienić swoją niezwykle popularną AI w „produkt przynoszący pieniądze” wired.com. Agenci mogą być kluczem do tej monetyzacji na kilka sposobów:
- Sprzedaż subskrypcji premium: Mówiąc wprost, tryb agenta to funkcja premium, która może zachęcić więcej użytkowników do płatnych planów. Ograniczając ją do subskrybentów Plus/Pro, OpenAI sprawia, że opłata miesięczna (20+ USD) jest atrakcyjniejsza dla zaawansowanych użytkowników chcących oddelegować zadania AI. To najprostszy sposób monetyzacji: uzyskać więcej płacących za dostęp do ChatGPT.
- Opłaty transakcyjne: Dyrektor generalny OpenAI, Sam Altman, zasugerował zarabianie prowizji od transakcji dokonywanych za pośrednictwem swojej AI. Spekulował, że OpenAI mogłoby „naliczać 2% opłaty od sprzedaży wygenerowanej” dzięki działaniom asystenta theguardian.com. Innymi słowy, jeśli Agent ChatGPT pomoże Ci kupić produkt lub zarezerwować hotel, OpenAI może pobrać niewielką prowizję (od sprzedawcy lub poprzez linki afiliacyjne). Taki model zamieniłby zakupy lub rezerwacje napędzane przez AI w źródło przychodu. Najnowsza prezentacja agenta pokazująca, jak prowadzi użytkownika do finalizacji zakupów detalicznych, natychmiast wywołała spekulacje, że OpenAI może wprowadzić takie opłaty afiliacyjne lub prowizyjne w przyszłości theguardian.com.
- Sponsorowane wyniki/reklamy: Asystenci AI mogą stać się nową platformą reklamową. Jeśli agent sugeruje produkty lub restauracje, czy marki będą płacić za polecenie? „Jakaś forma reklam lub sponsorowanych wyników wydaje się nieunikniona,” zauważa analityczka Niamh Burns, zwracając uwagę na „rosnącą presję [na firmy AI], aby monetyzować swoje produkty.” theguardian.com Istnieje już precedens — wyszukiwarki zarabiają na reklamach, więc AI, które zastąpi wyszukiwanie, również może to robić. Jednak OpenAI zaprzecza, aby obecnie wykorzystywało treści sponsorowane w rekomendacjach Agenta ChatGPT theguardian.com. Firma oświadczyła, że agent nie zawiera płatnych lokowań produktów, oraz „nie planuje tego zmieniać.” theguardian.com Obecnie wyniki mają być oparte wyłącznie na kryteriach użytkownika i ocenie AI. Niemniej jednak, w przyszłości, kiedy ekosystem asystenta się rozwinie, nie można wykluczyć pojawienia się modeli reklamowych.
- Usługi dla przedsiębiorstw: OpenAI może również zarabiać, oferując agenta jako część rozwiązań programowych dla firm. Na przykład, firmy mogą płacić za integrację ChatGPT Agent ze swoimi narzędziami wewnętrznymi lub za obsługę klienta realizowaną przez agenta. OpenAI już prowadzi negocjacje kontraktowe z Microsoftem w sprawie dalszej współpracy i można sobie wyobrazić, że zaawansowani agenci będą wchodzić w skład ofert Microsoftu (co pośrednio może przynieść przychody lub korzystne warunki dla OpenAI) wired.com. „Wykorzystania korporacyjne” były dużym czynnikiem przy projektowaniu agenta, jak twierdzi kierownik produktu Yash Kumar wired.com, co oznacza, że OpenAI prawdopodobnie zastanawia się, jak firmy mogą wykorzystać (i płacić za) tę technologię.
W najbliższym czasie OpenAI najprawdopodobniej skupi się na udoskonalaniu agenta i pozyskiwaniu subskrybentów. Ostatecznie jednak, jeśli agenci okażą się tak przydatni, jak obiecano, mogą umożliwiać przeprowadzanie całych transakcji czy procesów – i OpenAI z pewnością będzie chciało czerpać z tego korzyści. Firma musi zrównoważyć zaufanie użytkowników (agent rekomendujący produkty musi być postrzegany jako bezstronny, by wzbudzać zaufanie) z monetyzacją. To, jak to zrobią, będzie uważnie obserwowane. Jak zauważył analityk Burns, jeśli agent znajduje dla ciebie produkty, „co wchodzi w skład procesu wyszukiwania produktów przez taki system? Czy będą komercyjne umowy, w ramach których marki płacą, by być promowane przez asystentów…?” theguardian.com. OpenAI zapewnia, że obecnie nie, ale motywacja ekonomiczna istnieje.
Reakcje ekspertów i perspektywy
Debiut ChatGPT Agent wywołał zarówno ekscytację, jak i ostrożne komentarze ze strony ekspertów i pierwszych użytkowników. Ethan Mollick, profesor Wharton znany z eksperymentowania ze sztuczną inteligencją w edukacji, był w gronie pierwszych, którzy otrzymali dostęp. Jego werdykt był pozytywny: „Agent ChatGPT to, moim zdaniem, duży krok naprzód w kierunku tego, by AI wykonywały realną pracę. Już na tym etapie dobrze radzi sobie z autonomicznym prowadzeniem badań i tworzeniem arkuszy Excel (z formułami!), PowerPointa itd.”techmeme.com. Mollick powiedział, że daje to przedsmak tego, jak różne umiejętności agenta „łączą się ze sobą”, nawet jeśli nie jest to jeszcze idealnetechmeme.com. Inni badacze AI podzielali ten entuzjazm, wyrażając uznanie dla sposobu, w jaki ChatGPT Agent potrafi łączyć zadania i tworzyć gotowe wyniki, które wcześniej wymagały wielu ręcznych kroków.
Jednocześnie zauważa się, że testowanie w realnych warunkach dopiero się rozpoczęło. Na ile niezawodnie agent radzi sobie z chaotycznym, otwartym internetem, czy potrafi unikać oszustw lub dezinformacji podczas przeglądania sieci, oraz na ile przeciętni użytkownicy uznają go za naprawdę użytecznego – to są otwarte pytania. „Dopiero okaże się, jak naprawdę sprawdza się w rzeczywistych warunkach,” zauważył TechCrunch, ponieważ wcześniejsze agenty były podatne na błędy w nieprzewidzianych scenariuszach techcrunch.com. Istnieje również szersza społeczna obawa związana z przekazywaniem AI większej autonomii: nawet przy uprawnieniach kontrolnych z pewnością pojawią się historie o nietypowych lub ryzykownych decyzjach podejmowanych przez AI. Karta systemowa OpenAI przyznaje się do „nowych zagrożeń” wynikających z takiej autonomii i zobowiązuje się do prowadzenia dalszych badań nad ich minimalizacją openai.com openai.com.
Na tę chwilę wprowadzenie ChatGPT Agent stanowi kamień milowy w marszu AI od czysto asystenckiego generowania tekstu do rzeczywistego wykonywania zadań. To część zmiany paradygmatu od „chatbotów” do „agentów” – systemów AI, które mogą inicjować działania i realizować cele w cyfrowym świecie, a nie tylko rozmawiać. „Agent to dziś najmodniejsze z modnych określeń,” pisze WIRED, właśnie dlatego, że tak wiele firm dąży do urzeczywistnienia tej wizji wired.com. OpenAI mocno zaznacza swoją obecność na tym nowym terytorium, wykorzystując popularność i rozpoznawalność ChatGPT, by udostępnić agenta szerokiemu gronu odbiorców (a przynajmniej tym płacącym).
Podsumowanie: Jeśli jesteś uprawnionym użytkownikiem ChatGPT, możesz teraz powierzyć pewne nudne lub skomplikowane zadania cyfrowemu pomocnikowi AI i obserwować, jak wykonuje je krok po kroku. Może to sprawiać trochę magiczne wrażenie – jakbyś miał sumiennego stażystę, który nigdy nie śpi – a jednocześnie trochę niepokoić, widząc jak AI samodzielnie przegląda internet. Ten debiut to początek wielkiego eksperymentu, jak zwykli ludzie mogą korzystać z agentów AI. Jak ujął to jeden z pierwszych użytkowników: „[Agent] radzi sobie dobrze autonomicznie… Daje poczucie, jak agenty łączą się w całość.”techmeme.com W najbliższych miesiącach przekonamy się, czy ChatGPT Agent naprawdę spełnia obietnice wygody i produktywności oraz jak wypada na tle rosnącej konkurencji ze strony innych asystentów AI. Jedno jest pewne: era AI, która działa, a nie tylko rozmawia, właśnie się rozpoczęła.
Źródła:
- Booth, R. (2025, 17 lipca). The Guardian – OpenAI wprowadza asystenta osobistego zdolnego do zarządzania plikami i przeglądarkami internetowymi. theguardian.com theguardian.com theguardian.com theguardian.com theguardian.com
- OpenAI. (2025, 17 lipca). Wprowadzenie ChatGPT Agent: Łączymy badania i działanie (Oficjalny Blog OpenAI) openai.com openai.com openai.com openai.com
- Field, H. (2025, 17 lipca). The Verge – Nowy ChatGPT Agent od OpenAI może kontrolować cały komputer i wykonywać zadania za Ciebie. theverge.com theverge.com theverge.com theverge.com
- Zeff, M. (2025, 17 lipca). TechCrunch – OpenAI uruchamia uniwersalnego agenta w ChatGPT. techcrunch.com techcrunch.com techcrunch.com techcrunch.com
- Rogers, R. (2025, 17 lipca). WIRED – Nowy agent ChatGPT od OpenAI próbuje zrobić wszystko. wired.com wired.com wired.com wired.com
- Techmeme. (2025, 17 lipca). Zagregowane wiadomości technologiczne dotyczące uruchomienia ChatGPT Agent (w tym komentarz Ethana Mollicka)techmeme.com