오픈AI, 챗GPT 에이전트 출시 – 계획, 쇼핑, 파워포인트까지 도와주는 AI 비서

OpenAI는 2025년 7월 17일 목요일에 ChatGPT 에이전트 모드를 출시했다.
에이전트는 가상 컴퓨터를 사용해 웹 탐색, 양식 작성, 코드 실행, Excel 스프레드시트 및 PowerPoint 프레젠테이션 생성을 수행할 수 있다.
일정 관리, OpenTable 레스토랑 예약 검색, 온라인 쇼핑, 다단계 워크플로우의 전체 프레젠테이션 생성 등 자율적으로 작업을 처리한다.
비주얼 브라우저, 텍스트 기반 브라우저, 터미널/콘솔, 외부 API 호출뿐 아니라 Gmail, GitHub 등 커넥터를 통해 앱과 데이터를 연동할 수 있다.
작업을 할당하면 에이전트가 링크 클릭, 페이지 스크롤, 텍스트 입력, 코드 실행 등 필요한 모든 단계를 수행한다.
에이전트는 기본 GPT-4와 다른 새로운 AI 모델로 구동되며, Operator와 Deep Research를 하나의 워크플로우로 결합한다.
안전장치로는 사용자의 명시적 허용 없이는 고위험 행동 금지, 생물학/화학 위험 콘텐츠 차단, 실시간 분류기와 2차 안전 모델, Watch Mode, 장기 기억 비활성화가 있다.
유럽 경제 지역과 스위스에는 아직 출시되지 않았으며 EU 접근은 지연되고 있다.
초기 데모에서 에이전트의 작업 속도는 보통 10~15분 정도 걸리며, 복잡한 슬라이드 생성은 약 25분이 소요될 수 있다.
수익화 차원에서 Pro/Plus/Team 구독자에게 먼저 제공되며, Pro는 월 최대 400개의 에이전트 작업, Plus/Team은 월 40개의 작업이 포함되고 각 프롬프트당 1회로 계산된다.

ChatGPT, 챗봇에서 개인 비서로 진화하다

OpenAI는 ChatGPT에 대대적인 업그레이드를 적용하여, 인기 있는 챗봇을 개인 AI 비서로 탈바꿈시켰습니다. 이제 단순히 질문에 답하는 것뿐만 아니라 사용자를 대신해 행동까지 할 수 있습니다. ChatGPT “에이전트”로 명명된 이 새로운 기능은 목요일에 출시되었으며, ChatGPT가 자체 가상 컴퓨터를 사용해 “생각”하고 행동할 수 있게 해줍니다 ^[1]. 실질적으로, 사용자는 이제 ChatGPT에게 여러 단계의 작업을 맡길 수 있습니다. 예를 들어, 레스토랑 예약 찾기나 온라인 쇼핑, 전체 스프레드시트 및 슬라이드 프레젠테이션 생성까지 자율적으로 처리할 수 있습니다 ^[2]. OpenAI는 이 에이전트 모드를 통해 AI가 웹사이트를 탐색하고, 웹 브라우저와 앱을 제어하며, 파일을 관리하고, Excel 파일이나 PowerPoint 슬라이드와 같은 결과물을 생성할 수 있다고 밝혔습니다. 단순히 텍스트 응답만 제공하는 것이 아닙니다 ^[3].

이것이 중요한 이유: 이번 업그레이드는 OpenAI가 정적인 Q&A 챗봇을 넘어 디지털 비서 또는 “에이전트”처럼 작동하는 AI로 나아가기 위한 가장 대담한 시도입니다. 기존 챗봇과 달리, AI 에이전트는 사용자를 대신해 소프트웨어와 웹사이트와 상호작용하며 복잡하고 여러 단계의 작업 흐름을 수행할 수 있습니다 ^[4]. “에이전트가 사용자에게 실제로 유용성을 제공하고, 단순히 멋진 텍스트를 출력하는 것에 그치지 않고 실제로 무언가를 해줄 수 있기를 바란다”고 Enders Analysis의 수석 미디어 분석가 Niamh Burns는 말합니다 ^[5]. 본질적으로, ChatGPT의 새로운 에이전트 모드는 단순한 대화가 아니라 실제 온라인 작업을 사용자 대신 수행하는 것을 목표로 합니다.

OpenAI의 ChatGPT 에이전트는 내장된 “가상 컴퓨터”를 사용해 웹을 탐색하고, 양식을 작성하며, 코드를 실행하고, 심지어 사용자를 대신해 Excel 스프레드시트나 PowerPoint 프레젠테이션까지 생성할 수 있습니다 ^[6] ^[7].

새로운 ChatGPT 에이전트는 무엇을 할 수 있나요?

OpenAI는 ChatGPT Agent를 다양한 컴퓨터 기반 작업을 처리할 수 있는 범용 디지털 어시스턴트로 소개합니다 ^[8]. 예시로는 다음과 같은 작업이 있습니다:

일정 및 계획 관리:캘린더를 확인하고 다가오는 미팅을 요약해주거나, 저녁에 시간이 비는 날을 찾아 OpenTable에서 레스토랑 예약을 검색할 수 있습니다 ^[9] ^[10]. 일정과 레스토랑 예약 가능 시간을 대조해 데이트 밤 같은 이벤트도 계획할 수 있습니다.
온라인 리서치 및 보고서: 특정 주제에 대해 심층적인 웹 리서치를 수행하고 간결한 보고서나 분석을 작성할 수 있습니다. 예를 들어, 트렌드(예: “Beanie Babies vs. Labubus의 부상”)를 분석해 요약이나 상세 리서치 페이퍼를 생성할 수 있습니다 ^[11].
쇼핑 및 주문: 에이전트가 대신 온라인 쇼핑을 해줄 수 있습니다. 특정 기준에 맞는 상품을 찾아주거나, 옵션을 비교하고, 심지어 (허락을 받으면) 주문까지 할 수 있습니다 ^[12] ^[13]. OpenAI의 리서치 리드 Isa Fulford는 이 에이전트가 그녀의 구체적인 지시를 따라 컵케이크 한 상자를 주문하도록 했는데, 이 작업은 “거의 한 시간이나 걸렸지만” 직접 하는 것보다는 더 쉬웠다고 합니다 ^[14].
오피스 작업 – 스프레드시트 및 프레젠테이션: 아마도 가장 주목할 만한 점은, ChatGPT Agent가 편집 가능한 파일을 생성할 수 있다는 것입니다. 사용자의 프롬프트에 따라 처음부터 엑셀 스프레드시트나 파워포인트 슬라이드 데크를 생성할 수 있습니다 ^[15]. 예를 들어, 경쟁사에 대한 데이터를 분석하고 그 결과를 요약한 차트가 포함된 슬라이드 데크를 만들어 달라고 요청할 수 있습니다 ^[16]. 또한 새로운 데이터로 스프레드시트를 업데이트하거나, 여러 스크린샷을 포맷된 프레젠테이션으로 변환할 수도 있습니다 ^[17]. 출력 파일은 다운로드할 수 있으며, 표준 오피스 소프트웨어에서 열 수 있도록 설계되었습니다(단, OpenAI는 슬라이드 생성 기능이 아직 베타임을 주의하라고 안내합니다) ^[18].
개발자 도구 및 API 사용: 내부적으로, 에이전트는 프로그래밍 터미널에 접근할 수 있으며 공개 API를 호출할 수 있습니다. 이는 맞춤 계산을 수행하거나 외부 서비스를 쿼리하기 위해 코드를 실행할 수 있음을 의미합니다. Gmail이나 GitHub과 같은 앱과 “커넥터”를 통해 통합하여, 응답에 사용할 정보를(사용자 허가 하에) 가져올 수 있습니다 ^[19]. OpenAI는 ChatGPT Agent가 온라인 양식을 자동으로 작성하거나, API 호출을 통해 Google Drive나 SharePoint 같은 서비스와도 연동할 수 있다고 밝혔습니다 ^[20].

이 모든 기능은 AI에게 자체 “가상 브라우저/컴퓨터”를 제공함으로써 조율됩니다. 사용자가 작업을 할당하면, ChatGPT는 웹사이트를 탐색하고, 링크나 버튼을 클릭하며, 페이지를 스크롤하고, 텍스트 필드를 채우고, 코드를 작성 및 실행하는 등 – 과제를 완료하는 데 필요한 모든 단계를 수행합니다 ^[21] ^[22]. ChatGPT는 반복적이고 자율적으로 작동하며, 다음에 사용할 도구나 웹사이트를 스스로 결정합니다. 예를 들어, 일본식 저녁 식사 계획을 세울 때는 Google에서 레시피를 검색하고, 식재료를 주문하기 위해 식료품 사이트를 연 다음, 쇼핑 리스트 스프레드시트를 생성하는 등 – 모든 과정을 사용자가 일일이 지시하지 않아도 에이전트가 알아서 처리합니다.

ChatGPT Agent는 어떻게 작동하나요?

무대 뒤에서, ChatGPT Agent는 OpenAI가 에이전트 작업을 위해 특별히 구축한 새로운 AI 모델에 의해 구동됩니다. 이 모델은 기본 GPT-4 모델과는 별개입니다 ^[23]. 이 모델은 여러 도구(브라우저, API, 코드 등)를 순차적으로 사용해야 하는 복잡한 작업을 처리할 수 있도록 강화 학습을 통해 훈련되었습니다 ^[24]. 실제로 OpenAI는 두 개의 초기 실험 시스템인 Operator(브라우징/자동화 도구)와 Deep Research(심층 분석 도구)를 이 통합 에이전트로 합쳤습니다. “두 제품이 매우 상호보완적이라는 것을 깨닫고, 기본적으로 팀을 합치기로 결정했습니다,”라고 Fulford는 말합니다 ^[25]. 그 결과, 이 에이전트는 Operator의 웹 탐색 능력과 Deep Research의 정보 종합 능력을 하나의 워크플로우로 결합하게 되었습니다 ^[26].

기술 도구 상자: ChatGPT Agent는 여러 특화 도구를 갖추고 있습니다 ^[27]:

비주얼 브라우저는 사람이 하듯 일반 GUI를 통해 웹사이트와 상호작용할 수 있습니다(버튼 클릭, 페이지 이동 등).
텍스트 기반 브라우저는 빠른 HTTP 요청을 보내고 원시 텍스트를 파싱합니다(대용량 텍스트를 빠르게 읽거나 시각적 렌더링이 필요 없을 때 유용) ^[28].
터미널/콘솔은 샌드박스 환경 내에서 코드를 실행하거나 파일을 조작하거나 명령줄 유틸리티를 사용할 수 있게 해줍니다 ^[29].
직접 API 접근을 통해 외부 서비스의 API를 호출할 수 있습니다(예: Google Calendar에 게시, 데이터베이스 쿼리, 온라인 서비스에서 데이터 가져오기 등) ^[30].
사용자 계정에 대한 커넥터: 사용자는 자신의 앱(이메일이나 GitHub 등)을 연결할 수 있습니다. 허가를 받으면, 에이전트는 이메일, 캘린더 또는 기타 계정에서 관련 정보를 가져와 작업을 수행할 수 있습니다 ^[31]. 예를 들어, 요약문을 작성해야 할 때 최근 메시지를 찾기 위해 Gmail을 스캔하거나, API를 통해 캘린더를 확인해 자유 시간을 찾을 수 있습니다.

이러한 도구들은 AI가 작업에 대해 최적의 접근 방식을 선택할 수 있도록 해줍니다. 예를 들어, API를 사용해 빠르게 캘린더의 가능 일정을 확인한 다음, 클릭과 인간과 유사한 상호작용이 필요한 OpenTable 예약 페이지를 탐색하기 위해 시각적 브라우저로 전환할 수 있습니다 ^[32]. 텍스트 브라우저나 API를 통해 파일을 다운로드하고, 터미널에서 코드를 실행해 파일을 분석하거나 재포맷한 뒤, 결과를 시각적 브라우저에서 열어 보여줄 수도 있습니다 ^[33]. 이 모든 과정은 에이전트의 가상 머신 내에서 이루어지며, 실제 사용자의 기기와는 분리되어 있습니다. 즉, AI가 자신의 컴퓨터를 가지고 사용자의 지시를 수행하는 것과 같습니다 ^[34].

사용자 경험: 최종 사용자에게 ChatGPT Agent 사용은 간단합니다. 이 기능은 접근 권한이 있는 사용자를 위해 ChatGPT 인터페이스의 새로운 “Agent mode”를 통해 제공됩니다 ^[35]. 작업을 프롬프트로 시작하면(또는 슬래시 명령어 “/agent”를 입력할 수도 있음) AI가 그 다음을 처리합니다 ^[36]. 작업이 진행되는 동안 화면 내 내레이션을 통해 에이전트가 단계별로 무엇을 하고 있는지 보여줍니다. 예를 들어, “maps.google.com으로 이동 중… ‘내 근처 이탈리안 레스토랑’ 검색 중…”과 같이 따라갈 수 있습니다 ^[37] ^[38]. 특히, 언제든지 에이전트를 중단하거나 조정할 수 있습니다. 프로세스를 일시 정지해 지시를 명확히 하거나 다른 접근 방식을 요청할 수 있으며, 에이전트는 진행 상황을 잃지 않고 작업 중간에 적응합니다 ^[39]. 이러한 협업 루프는 AI가 사용자의 목표에 맞춰 움직이도록 설계되었습니다.

안전 기능: AI 행동을 통제하기

AI에게 온라인에서 행동할 수 있는 권한을 부여하는 것은 명백한 안전 문제를 야기하며, OpenAI도 이 새로운 모드가 “이전 모델보다 더 많은 위험”을 수반한다고 인정하고 있습니다 ^[40]. 이를 완화하기 위해 OpenAI는 여러 안전장치와 제한을 도입했습니다:

민감한 행동에 대한 사용자 허가: “항상 사용자가 통제합니다,”라고 OpenAI는 강조합니다 ^[41]. ChatGPT Agent는 구매, 이메일 전송, 예약과 같이 심각한 결과를 초래할 수 있는 행동을 하기 전에 반드시 명시적 확인을 요청합니다 ^[42] ^[43]. 사용자가 이러한 되돌릴 수 없는 단계를 승인해야 하므로, AI가 사용자의 모르게 아마존에서 1,000달러 상당의 기기를 충동적으로 주문하는 일을 방지할 수 있습니다.
“고위험” 콘텐츠 제한(생물/화학): 에이전트의 향상된 기능을 고려해, OpenAI는 이를 “고생물학적 및 화학적 위험” 카테고리로 분류했습니다. 비록 “확실한 증거는 없다”고 밝혔지만, 이 에이전트가 생물무기 제작에 도움을 줄 수 있다는 ^[44] ^[45]. 이 예방 조치(Preparedness Framework의 일부)로 인해 추가 안전장치가 활성화됩니다. 구체적으로, OpenAI는 모든 에이전트 프롬프트에 대해 실시간 콘텐츠 분류기를 실행하여 생물학 또는 화학과 관련이 있는지 확인하고, 관련이 있을 경우 두 번째 안전 모델이 에이전트의 응답을 검토해 위험한 지침이 제공되지 않도록 합니다 ^[46] ^[47]. 즉, 누군가가 에이전트를 악용해 유독 물질을 만들려고 시도할 경우, 시스템이 이를 감지하고 차단하도록 설계되어 있습니다.
유해한 작업 거부 훈련: 이 에이전트는 특정 의심스럽거나 악의적인 요청을 거부하도록 훈련되었습니다. 예를 들어, 알 수 없는 계좌로 은행 이체를 하거나 파괴적인 명령을 실행하는 등 명백히 위험하거나 비윤리적인 일을 하도록 요청받으면 거부합니다 ^[48]. OpenAI는 레드팀과 도메인 전문가들이 “현실적인 시나리오”를 바탕으로 시스템을 테스트해 이러한 거부 기능을 강화했다고 밝혔습니다 ^[49].
장기 기억 비활성화: 흥미로운 제한 사항 중 하나는 – 에이전트 모드에서 ChatGPT의 장기 대화 기억이 꺼져 있다는 점입니다 ^[50]. 일반적으로 ChatGPT는 대화 중 이전 정보나 과거 세션(활성화된 경우)의 정보를 기억할 수 있지만, OpenAI는 영리한 공격자가 에이전트 작업 중(프롬프트 인젝션 등) 이를 악용해 민감한 데이터를 유출시키거나 원치 않는 행동을 하게 만들 수 있다고 우려했습니다 ^[51]. 그 결과, 현재 에이전트는 상태를 저장하지 않고 이전 대화의 정보를 이어받지 않는 방식으로 작동합니다. OpenAI는 안전하다고 확신이 들면 추후 메모리 기능을 다시 활성화할 수 있지만, 현재로서는 이러한 “추가 예방 조치”로 잠재적 데이터 유출을 방지하고 있습니다 ^[52].
금융 거래 제한: OpenAI는 또한 금융 관련 작업을 제한하고 있습니다. 예를 들어, 에이전트는 요청받더라도 송금이나 주식 거래를 실행하지 않습니다 ^[53]. 실제로 “감시 모드(Watch Mode)”라는 안전장치가 있어, 에이전트가 은행이나 트레이딩 플랫폼 등 민감한 웹사이트를 탐색할 때 사용자가 에이전트 브라우저 탭에서 벗어나면 활동이 일시 중지되어, 백그라운드에서 몰래 작업이 이뤄지는 것을 방지합니다 ^[54].
광범위한 테스트 및 버그 바운티 프로그램: OpenAI는 이 모델이 위협 모델링 및 모니터링 측면에서 “지금까지 가장 포괄적인 안전 스택”을 갖추고 있다고 자랑합니다 ^[55] ^[56]. 그들은 외부 생명과학 보안 전문가와 협력했으며, 출시 전에 도메인 전문가들이 레드팀 테스트를 진행했습니다 ^[57]. 출시와 함께 OpenAI는 위험을 설명하는 상세한 시스템 카드를 공개했으며, 외부 연구자들이 취약점을 보고하도록 장려하기 위해 버그 바운티도 제공하고 있습니다 ^[58] ^[59].

이러한 예방 조치에도 불구하고, OpenAI는 AI가 실제 인터넷 환경에서 작동할 때 예상치 못한 행동이 여전히 나타날 수 있음을 알고 있습니다. 회사는 에이전트를 반복적으로 개선하고 필요에 따라 안전장치를 조정할 것이라고 밝혔습니다. 현재로서는 사용자가 에이전트의 행동을 감독할 것을 권장하며(인터페이스가 모든 단계를 설명함으로써 이를 유도합니다), “이 모델에는 이전 모델보다 더 많은 위험이 있다”고 OpenAI는 인정합니다. 그래서 “지금 신중을 기하고 필요한 안전장치를 구현하고 있다”고 밝혔습니다 ^[60] ^[61].

초기 한계: 속도와 신뢰성

아직 인간 비서를 해고하지 마세요. 초기 데모와 테스트에서 ChatGPT Agent는 인상적인 능력과 함께 뚜렷한 한계점도 보여주었습니다:

느리고 꾸준하게: 에이전트는 종종 작업을 완료하는 데 시간이 걸립니다. 정보를 수집하기 위해 여러 분 동안 클릭하고 탐색하는 경우가 많아, 챗봇이 직접 답변하는 것보다 훨씬 오래 걸릴 수 있습니다. 한 시연에서는, 에이전트가 Google 캘린더와 레스토랑 사이트를 살펴보며 저녁 식사 옵션을 제안하는 데 약 10~15분이 걸렸습니다 ^[62]. 복잡한 슬라이드 데크를 생성하거나 광범위한 조사를 수행하는 데는 더 오래 걸릴 수 있습니다(오픈AI 직원에 따르면 슬라이드 작업에 테스트에서 약 25분이 소요됨) ^[63]. “설령 15분, 30분이 걸린다 해도, 사용자가 직접 하는 것에 비하면 꽤 큰 시간 단축입니다,”라고 풀포드는 말하며, 사용자가 작업을 시작해두고 그동안 다른 일을 할 수 있다는 점을 지적합니다 ^[64]. 그래도 인내심이 필요합니다. 에이전트는 즉각적이지 않습니다. 오픈AI의 야쉬 쿠마르는 현재 버전에서 평균 작업 시간이 약 10~15분이라고 추정합니다 ^[65].
가끔 발생하는 문제: 다른 AI와 마찬가지로, 에이전트도 실수를 하거나 작업 중에 “멈추는” 경우가 있습니다. 초기 사용자들은 다양한 결과를 보고했습니다. 일부 복잡한 워크플로우는 에이전트를 혼란스럽게 하거나, 작업 도중 지시를 잘못 해석할 수 있습니다. 한 초기 테스터는 에이전트가 “내가 준 세 가지 작업 모두 실패했다… 미래를 엿볼 수 있는 좋은 경험이었지만, 아직은 실용적이지 않다.”라고 평했습니다 ^[66]. 이는 이 기술이 발전했지만 완벽하지 않음을 보여줍니다. 오픈AI 역시 에이전트가 “아직 초기 단계”이며 “여전히 실수를 할 수 있다”고 밝히고 있습니다 ^[67]. 향후 업데이트를 통해 신뢰성과 추론 능력이 향상될 것으로 기대됩니다.
기본 출력 품질: PowerPoint/슬라이드 생성 기능은 현재 베타 단계로, 생성된 슬라이드가 다소 단조로워 보이거나 다듬기가 필요할 수 있습니다 ^[68]. OpenAI는 화려한 디자인보다는 먼저 콘텐츠와 구조를 제대로 만드는 데 집중했습니다. 포맷이 기본적일 수 있고, 슬라이드 미리보기와 내보낸 PowerPoint 파일 간에 불일치가 발생할 수 있다고 경고합니다 ^[69]. 마찬가지로, 에이전트가 스프레드시트를 편집하고 수식을 유지할 수는 있지만, 아직 숙련된 인간 수준의 Excel 마법사는 아닙니다. OpenAI는 이미 프레젠테이션에서 더 “다듬어지고 정교한 출력물”을 생성할 수 있도록 다음 버전을 훈련 중입니다 ^[70].
유럽 출시 없음(아직): 주목할 점은 ChatGPT 에이전트가 EU에서 출시되지 않았다는 것입니다. OpenAI는 “유럽 경제 지역 및 스위스에서의 접근을 가능하게 하기 위해 아직 작업 중”이라고 밝혔습니다 ^[71]. 다른 지역(미국, 영국 포함)에서는 즉시 접근이 가능했지만, 유럽 사용자는 무기한 대기 중입니다. OpenAI는 EU 출시 일정에 대해 확정된 일정을 제시하지 않았습니다 ^[72]. 이는 규제 문제와 관련이 있을 가능성이 높으며, EU의 엄격한 데이터 및 AI 규정으로 인해 OpenAI가 자율 에이전트 출시 전 추가적인 준수 절차를 거쳐야 할 수 있습니다. 현재로서는 유럽 사용자에게 해당 기능이 해당 지역에서 사용할 수 없다는 메시지만 표시됩니다.

긍정적인 측면에서, OpenAI는 새로운 에이전트의 기반 모델이 이전 버전들보다 훨씬 더 뛰어나다고 주장하며, 이는 복잡성 처리에 유리한 신호입니다. 이 모델은 여러 까다로운 벤치마크에서 최첨단 점수를 기록했다고 합니다 ^[73]. 예를 들어, 100개 이상의 과목에 걸친 대규모 전문가 수준의 시험인 “Humanity’s Last Exam”에서 41.6%를 기록했는데, 이는 OpenAI의 이전 모델이 해당 시험에서 기록한 점수의 약 두 배에 해당합니다 ^[74]. 악명 높은 어려운 수학 벤치마크(FrontierMath)에서는 도구 사용 시 27.4%의 정확도를 달성했으며, 이는 이전 최고 모델의 6.3%에 비해 크게 향상된 수치입니다 ^[75]. 이러한 개선은 에이전트가 도구를 사용할 수 있을 때 복잡하고 다단계의 문제를 해결하는 데 훨씬 더 뛰어남을 시사합니다. “OpenAI는 ChatGPT 에이전트가 이전 제품들보다 훨씬 더 뛰어나다고 말한다,”고 TechCrunch는 보도했습니다 ^[76]. 하지만 더 많은 사용자가 실제 환경에서 한계까지 밀어붙이기 전까지는, 통제된 테스트 외부에서 실제로 얼마나 “뛰어난지”는 두고 볼 일입니다 ^[77].

이용 가능성: 누가 ChatGPT 에이전트를 사용할 수 있나요?

OpenAI는 처음에 ChatGPT 에이전트를 유료 구독자만을 위한 혜택으로 출시하고 있습니다. 이번 주부터 이 기능은 ChatGPT의 Pro, Plus, Team 요금제(프리미엄 등급에 해당)에 가입한 사용자에게 제공되고 있습니다 ^[78]. Pro 사용자가 먼저(출시 당일) 접근 권한을 받으며, 이후 며칠 내에 Plus와 Team 구독자에게도 제공될 예정입니다 ^[79]. 엔터프라이즈 및 교육 요금제 고객은 문제가 해결되는 대로 “몇 주 내”에 이용할 수 있게 됩니다 ^[80] ^[81]. 무료 사용자에게 에이전트 기능이 제공될 예정에 대한 공식 일정은 발표되지 않았으며, 추가 가치와 높은 연산 비용을 고려할 때 가까운 미래에는 유료 기능으로 남을 가능성이 있습니다.

계층별 접근과 함께, OpenAI는 월별 사용 한도를 도입했습니다. Pro 구독자(최상위 계층)는 한 달에 최대 400개의 에이전트 작업을 실행할 수 있고, Plus 및 Team 사용자는 월 40개의 작업이 포함되어 있습니다 ^[82] ^[83]. 이 한도는 비용이 많이 드는 작업이 무분별하게 실행되는 것을 방지하지만, 추가 사용이 필요한 경우 크레딧 시스템을 통해 구매가 가능할 수 있습니다 ^[84]. 작업은 “에이전트 프롬프트”당 1회로 계산되며, 에이전트를 활성화하여 무언가를 시킬 때마다 1회로 간주됩니다.

앞서 언급했듯이, 유럽 사용자는 ChatGPT Agent에 접근할 수 없습니다 출시 시점에 ^[85]. 비-EU 사용자가 에이전트 모드를 켜면, 해당 기능이 실험적임을 경고받고 계속 진행할 수 있습니다. 그러나 EU 사용자는 단순히 차단됩니다. OpenAI가 EEA 접근을 위해 노력 중이라는 언급은, 지연의 원인이 EU 규정(아마도 개인정보 보호 및 AI 법 관련) 준수 때문임을 시사합니다. 이러한 지역 제한 출시는 이전에 일부 ChatGPT 기능(예: 웹 브라우징)이 법적 불확실성으로 인해 일시적으로 특정 지역에서 제공되지 않았던 것과 유사합니다. 현재로서는, EU 내 모든 사용자는 OpenAI가 에이전트가 현지 요건을 충족한다고 보장할 때까지 기다려야 합니다.

AI 에이전트 군비 경쟁 – Google, Anthropic 및 기타

OpenAI의 “에이전트형” AI 진출은 더 넓은 업계 트렌드인 자율 AI 어시스턴트로의 움직임 속에서 이루어지고 있습니다. 실제로, 경쟁사들도 자체 에이전트형 기능을 준비해왔습니다:

Anthropic의 Claude: 지난해, Anthropic(Claude 챗봇 개발사)은 “컴퓨터 사용”이라는 기능을 도입했습니다. 이는 본질적으로 Claude가 사람처럼 컴퓨터를 사용할 수 있게 해주는 것으로, 웹사이트를 탐색하거나 사용자의 기기에서 작업을 수행할 수 있습니다 ^[86]. 불과 두 달 전(2025년 5월), Anthropic은 최신 모델인 Claude 2(코드명 Opus 4)를 에이전트 기능과 함께 출시했고, 유사하게 특별 생물안전 조치를 활성화하여 오용을 방지했습니다 ^[87]. 이는 소규모 AI 스타트업조차도 자율 에이전트의 힘과 위험성을 모두 인식하고 있음을 보여줍니다.
구글의 AI 확장 기능: 구글은 생성형 AI(예: Bard와 Assistant)를 직접적인 작업 수행과 통합하는 작업을 진행해 왔습니다. 구글은 Gmail에서 이메일 초안 작성, Google Drive에서 문서 요약, 그리고 실험적인 “Duet AI”를 통해 브라우저 제어까지 시연한 바 있습니다. Guardian에 따르면, 구글은 최근 앱 간 전환을 하며 사용자 작업을 완료할 수 있는 유사한 어시스턴트 “에이전트”를 출시했다고 합니다 ^[88]. 또한, 바로 지난주 구글은 에이전트형 AI 프로젝트를 강화하기 위해 스타트업(Windsurf)에서 핵심 인력을 영입했습니다 ^[89]. 이는 Jarvis와 같은 어시스턴트 개발을 위한 경쟁이 치열해지고 있음을 보여줍니다.
기타 기업들: 메타(페이스북)와 아마존 역시 실적 발표에서 AI 에이전트에 대한 포부를 언급하며, 빅테크 모두가 이를 차세대 핵심 기술로 보고 있음을 시사했습니다 ^[90]. 예를 들어, 이커머스 기업들은 AI 에이전트가 고객 서비스 채팅이나 쇼핑 요청을 처음부터 끝까지 처리하는 모습을 상상합니다. 인상적인 초기 사례로, 핀테크 기업 Klarna는 2024년 초 AI 고객 서비스 에이전트가 전체 고객 채팅의 3분의 2를 처리하며 약 700명의 인간 업무를 대체했다고 보고했습니다 ^[91]. 이 성공 사례는 기업계에서 “AI 에이전트”라는 용어를 대중화하는 데 기여했으며, 이후 많은 CEO들이 에이전트 기반 AI를 목표로 내세우고 있습니다 ^[92].
과거 실험들: OpenAI 자체도 이전에 에이전트 분야에 발을 들인 적이 있습니다. 2025년 1월, Operator를 연구 프리뷰로 출시했으며, “웹에 접속해 사용자를 대신해 작업을 수행할 수 있는 에이전트”라고 설명했습니다 ^[93]. Operator는 웹사이트를 클릭하고 스크롤할 수 있었습니다. 또한 장문의 분석을 작성할 수 있는 Deep Research 모드도 있었습니다. 하지만 이러한 선구자들은 범위가 제한적이고 때로는 불안정했습니다. (Adept AI의 ACT-1과 같은) 다른 스타트업들도 인간처럼 소프트웨어에서 명령을 실행할 수 있는 에이전트를 선보였지만, 아직 주류 제품이 된 것은 없습니다. 초기 AI 에이전트 세대들은 복잡한 작업과 신뢰성에서 어려움을 겪었습니다 ^[94] – 종종 많은 수동적 개입이 필요했습니다. 기술 경영진들은 모든 것을 할 수 있는 AI 비서를 그렸지만, 현실은 과장된 기대에 미치지 못했습니다 ^[95].

이제 ChatGPT Agent를 통해 OpenAI는 이전의 시도들을 뛰어넘으려 하고 있습니다. (웹 브라우징 + 분석)이라는 강점을 결합하고 GPT-4 수준의 지능을 활용해, 마침내 거대한 비전에 근접한 에이전트를 만들었다고 주장합니다. “이건 에이전트 역사상 최고의 UX다. 완전히 미쳤다. 이걸 이겨봐라!!” 한 흥분한 사용자가 출시 후에 남긴 글입니다 ^[96]. 물론 이런 반응은 과장된 것이지만, AI 커뮤니티 일부에서 우리가 “J.A.R.V.I.S.” – 아이언맨의 가상 AI 집사 –에 한 걸음 더 다가가고 있다는 기대감을 보여줍니다 ^[97]. 현재로서는 ChatGPT Agent와 그 동료들은 아직 그 이상적인 모습에 이르는 초기 단계에 불과하며, 주로 연구, 코딩, 기본적인 온라인 심부름을 처리할 뿐 진정한 범용 자율성에는 이르지 못했습니다 ^[98]. 하지만 경쟁의 흐름은 분명합니다: 모든 AI 기업이 사람들이 실제로 매일 사용할 AI 비서를 가장 먼저 완성하고자 합니다.

수익화: 에이전트가 OpenAI에 돈을 벌어줄까?

ChatGPT Agent 출시로 OpenAI는 새로운 기술을 선보이는 것뿐만 아니라, 잠재적인 수익원에도 주목하고 있습니다. 이 회사는 ChatGPT 개발에 막대한 보조금을 투입했으며(마이크로소프트가 수십억 달러를 투자), 이 인기 AI를 “수익 창출 제품”으로 전환해야 합니다 ^[99]. 에이전트는 몇 가지 방식으로 이러한 수익화의 핵심이 될 수 있습니다:

구독 업셀: 간단히 말해, 에이전트 모드는 프리미엄 기능으로, 더 많은 사용자가 유료 플랜으로 전환하도록 유도할 수 있습니다. 이를 Plus/Pro 구독자에게만 제한함으로써, OpenAI는 AI 비서를 통해 업무를 분담하고자 하는 파워 유저들에게 월 $20 이상의 요금이 더 매력적으로 느껴지게 만듭니다. 이것이 가장 직접적인 즉각적 수익화 방식입니다: 더 많은 사람들이 ChatGPT 이용료를 지불하도록 만드는 것이죠.
거래 수수료: OpenAI의 CEO 샘 알트먼은 AI를 통한 상거래에서 수수료를 얻는 방안을 시사한 바 있습니다. 그는 OpenAI가 “AI 비서가 창출한 매출에 대해 2%의 수수료를 부과할 수 있다”고 언급했습니다 ^[100]. 즉, ChatGPT Agent가 제품 구매나 호텔 예약을 도와줄 경우, OpenAI가 소정의 수수료(판매자나 제휴 링크를 통해)를 받을 수 있다는 의미입니다. 이 모델은 AI 기반 쇼핑이나 예약을 수익원으로 전환시킵니다. 최근 에이전트 데모에서 사용자를 소매 결제로 안내하는 모습이 공개되자, OpenAI가 향후 제휴 또는 추천 수수료를 통합할 수 있다는 이야기가 즉각적으로 나왔습니다 ^[101].
스폰서 결과/광고: AI 비서는 광고를 위한 새로운 플랫폼이 될 수 있습니다. 에이전트가 제품이나 식당을 추천한다면, 브랜드가 추천을 받기 위해 비용을 지불할까요? “어떤 형태로든 광고나 스폰서 배치가 불가피해 보인다”고 분석가 니암 번스는 말하며, “AI 기업에 대한 제품 수익화 압력이 커지고 있다”고 지적합니다. ^[102] 이미 선례가 있습니다 – 검색 엔진은 광고로 수익을 내고 있으니, 검색을 대체하는 AI도 마찬가지일 수 있습니다. 하지만 OpenAI는 현재 ChatGPT Agent의 추천에 스폰서 콘텐츠를 사용하지 않는다고 부인했습니다 ^[103]. 그들은 에이전트가 유료 제품 배치를 포함하지 않으며, “이를 변경할 계획이 없다”고 밝혔습니다. ^[104] 현재로서는 결과가 오로지 사용자의 기준과 AI의 판단에만 기반한다고 합니다. 하지만, 에이전트 생태계가 성숙하면 향후 광고 모델 도입의 여지는 남아 있습니다.
엔터프라이즈 서비스: OpenAI는 에이전트를 엔터프라이즈 소프트웨어 솔루션의 일부로 제공함으로써 수익을 창출할 수도 있습니다. 예를 들어, 기업들은 ChatGPT Agent를 내부 도구에 통합하거나 고객 지원을 처리하도록 하기 위해 비용을 지불할 수 있습니다. OpenAI는 이미 Microsoft와의 지속적인 파트너십에 대해 계약 협상을 진행 중이며, 고급 에이전트가 Microsoft의 제품군에 패키지로 포함되는 것을 상상할 수 있습니다(이는 간접적으로 OpenAI에 수익이나 유리한 조건을 가져다줄 수 있습니다) ^[105]. “엔터프라이즈 사용 사례”는 제품 책임자 Yash Kumar에 따르면 에이전트 설계에서 큰 고려사항이었다고 하며 ^[106], 이는 OpenAI가 기업들이 이 기술을 어떻게 활용(그리고 비용을 지불)할 수 있을지 고민하고 있음을 의미합니다.

단기적으로 OpenAI의 초점은 에이전트를 다듬고 구독을 유도하는 데 있을 가능성이 높습니다. 하지만 궁극적으로 에이전트가 약속한 만큼 유용해진다면, 전체 거래나 워크플로우를 촉진할 수 있고 – OpenAI는 분명히 그로부터 일부 가치를 포착하려 할 것입니다. 회사는 사용자 신뢰(제품을 추천하는 에이전트가 신뢰받으려면 편향되지 않아야 함)와 수익화 사이의 균형을 맞춰야 합니다. 그들이 어떻게 이 균형을 맞출지는 면밀히 주시될 것입니다. 분석가 Burns가 생각한 것처럼, 만약 에이전트가 당신을 위해 제품을 찾아준다면, “그 시스템이 제품을 찾는 과정에는 무엇이 들어갈까? 브랜드가 어시스턴트에 노출되기 위해 비용을 지불하는 상업적 거래가 있을까…?” ^[107]. OpenAI는 현재로서는 아니라고 주장하지만, 경제적 유인은 존재합니다.

전문가 반응 및 전망

ChatGPT Agent의 출시는 전문가들과 초기 사용자들로부터 기대와 신중한 논평을 모두 이끌어냈습니다. Ethan Mollick은 AI를 교육에 실험적으로 도입하는 것으로 알려진 와튼스쿨 교수로, 소수의 초기 접근 그룹에 포함되었습니다. 그의 평가는 긍정적이었습니다: “ChatGPT agent는, 제 생각에, AI가 실제 작업을 하도록 만드는 데 큰 진전입니다. 이 단계에서도, 스스로 연구를 하고 Excel 파일(수식 포함!), 파워포인트 등을 잘 조립합니다.” ^[108]. Mollick은 아직 완벽하진 않지만 다양한 에이전트 기능이 “하나로 모여가는” 모습을 엿볼 수 있었다고 말했습니다 ^[109]. 다른 AI 연구자들도 이와 비슷한 의견을 내며, ChatGPT Agent가 작업을 연쇄적으로 수행하고 이전에는 여러 수작업이 필요했던 결과물을 만들어내는 방식에 감명을 받았다고 했습니다.

동시에, 실제 환경에서의 테스트는 이제 막 시작되었다는 점도 인식되고 있다. 에이전트가 복잡하고 혼란스러운 오픈 인터넷 환경을 얼마나 신뢰성 있게 다루는지, 웹을 탐색하면서 사기나 허위정보에 속지 않을 수 있는지, 그리고 일반 사용자들이 실제로 얼마나 유용하다고 느끼는지 등은 아직 답이 정해지지 않은 질문들이다. “실제 환경에서 얼마나 유능한지는 두고 봐야 한다”고 TechCrunch는 지적했다. 이전의 에이전트들은 예기치 못한 상황에 직면했을 때 취약했기 때문이다 ^[110]. 또한 AI에게 더 많은 자율권을 부여하는 것에 대한 사회적 우려도 있다. 권한 확인 절차가 있더라도, AI가 이상하거나 위험한 결정을 내리는 사례가 분명히 등장할 것이다. OpenAI의 자체 시스템 카드에서도 이러한 자율성에 따른 “새로운 위험”을 인정하며, 이를 완화하기 위한 지속적인 연구를 약속하고 있다 ^[111] ^[112].

현재로서는, ChatGPT Agent의 도입은 AI가 단순한 텍스트 생성 보조를 넘어 실제 작업 수행으로 나아가는 데 있어 하나의 이정표를 의미한다. 이는 “챗봇”에서 패러다임의 전환을 거쳐 “에이전트”로 나아가는 흐름의 일부다. 즉, AI 시스템이 단순히 대화만 하는 것이 아니라 주도적으로 목표를 달성하고 작업을 완수할 수 있게 된 것이다. “에이전트는 지금 가장 화제가 되는 단어다”라고 WIRED는 전한다. 수많은 기업들이 이 비전을 좇고 있기 때문이다 ^[113]. OpenAI는 ChatGPT의 인기와 친숙함을 활용해 대중(적어도 유료 사용자)에게 에이전트를 선보이며 이 새로운 영역에 확고히 깃발을 꽂았다.

핵심 요약: 만약 당신이 자격이 되는 ChatGPT 사용자라면, 이제 일부 지루하거나 복잡한 작업을 AI 도우미에게 맡기고 단계별로 처리하는 모습을 지켜볼 수 있다. 마치 잠들지 않는 성실한 인턴을 둔 듯한 마법 같은 느낌이 들 수도 있고, AI가 스스로 웹을 돌아다니는 모습을 보면 다소 불안할 수도 있다. 이번 출시는 일상적인 사람들이 AI 에이전트를 어떻게 활용할지에 대한 대규모 실험의 시작이다. 한 초기 사용자는 이렇게 말했다: “[이것은] 자율적으로 잘 처리한다… 에이전트가 어떻게 결합되어 가는지 감을 준다.” ^[114] 앞으로 몇 달 동안 ChatGPT Agent가 정말로 편의성과 생산성이라는 약속을 지키는지, 그리고 경쟁이 치열해지는 AI 어시스턴트들과 어떻게 비교되는지 지켜보게 될 것이다. 한 가지는 분명하다. 행동하는, 단순히 대화만 하는 것이 아닌 AI의 시대가 공식적으로 시작되었다.

출처:

Booth, R. (2025, 7월 17일). The Guardian – OpenAI, 파일 및 웹 브라우저 제어가 가능한 개인 비서 출시. ^[115] ^[116] ^[117] ^[118] ^[119]
OpenAI. (2025, 7월 17일). ChatGPT Agent 소개: 연구와 행동의 다리 놓기 (공식 OpenAI 블로그) ^[120] ^[121] ^[122] ^[123]
Field, H. (2025, 7월 17일). The Verge – OpenAI의 새로운 ChatGPT Agent, 컴퓨터 전체를 제어하고 작업을 대신 수행할 수 있다. ^[124] ^[125] ^[126] ^[127]
Zeff, M. (2025, 7월 17일). TechCrunch – OpenAI, ChatGPT에서 범용 에이전트 출시. ^[128] ^[129] ^[130] ^[131]
Rogers, R. (2025, 7월 17일). WIRED – OpenAI의 새로운 ChatGPT 에이전트, 모든 것을 시도하다. ^[132] ^[133] ^[134] ^[135]
Techmeme. (2025, 7월 17일). ChatGPT 에이전트 출시 관련 종합 기술 뉴스(이선 몰릭의 논평 포함) ^[136]