OpenAI lance ChatGPT Agent : l’assistant IA capable de planifier, faire des achats et créer des PowerPoints pour vous

ChatGPT évolue du chatbot à l’assistant personnel
OpenAI a lancé une mise à jour majeure de ChatGPT, transformant le populaire chatbot en un assistant IA personnel capable non seulement de répondre aux questions, mais aussi d’agir au nom de l’utilisateur. Surnommée ChatGPT “Agent”, la nouvelle fonctionnalité a été lancée jeudi et permet à ChatGPT de “réfléchir” et d’agir en utilisant son propre ordinateur virtuel theguardian.com. Concrètement, les utilisateurs peuvent désormais demander à ChatGPT de gérer des tâches à plusieurs étapes – de la recherche de réservations de restaurant ou d’achats en ligne à la génération autonome de tableurs et de présentations de diapositives theguardian.com. OpenAI affirme que ce mode agent permet à l’IA de naviguer sur des sites web, de contrôler des navigateurs et des applications, de gérer des fichiers et de produire des résultats comme des fichiers Excel ou des présentations PowerPoint, au lieu de simplement fournir des réponses textuellestechmeme.com.
Pourquoi c’est important : Cette mise à jour est l’initiative la plus audacieuse d’OpenAI pour aller au-delà d’un simple chatbot de questions-réponses vers une IA qui fonctionne comme un assistant numérique ou “agent”. Contrairement aux chatbots classiques, les agents IA peuvent exécuter des flux de travail complexes et à plusieurs étapes en interagissant avec des logiciels et des sites web au nom de l’utilisateur theverge.com. “L’espoir est que les agents puissent apporter une réelle utilité aux utilisateurs – qu’ils fassent réellement des choses pour eux plutôt que de simplement produire un texte soigné et impressionner,” note Niamh Burns, analyste média senior chez Enders Analysis theguardian.com. En somme, le nouveau mode agent de ChatGPT vise à tenir cette promesse en effectuant de véritables tâches en ligne pour les utilisateurs, et pas seulement discuter.
L’Agent ChatGPT d’OpenAI utilise un “ordinateur virtuel” intégré pour naviguer sur le web, remplir des formulaires, exécuter du code, et même produire des tableurs Excel ou des présentations PowerPoint au nom de l’utilisateur openai.comtechmeme.com.
Que peut faire le nouvel Agent ChatGPT ?
OpenAI présente ChatGPT Agent comme un assistant numérique polyvalent capable de s’attaquer à une grande variété de tâches informatiques techcrunch.com. Voici quelques exemples de ce qu’il peut faire :
- Gérer les emplois du temps et les plans : Consultez votre agenda et recevez un briefing sur vos prochaines réunions, ou trouvez une soirée où vous êtes disponible puis cherchez des réservations de restaurant sur OpenTable openai.com theverge.com. Il peut organiser des événements comme une soirée en amoureux en croisant votre emploi du temps avec la disponibilité des restaurants.
- Recherche en ligne et rapports : Effectuez des recherches approfondies sur le web à propos d’un sujet et compilez un rapport concis ou une analyse. Par exemple, il pourrait analyser des tendances (ex. « la montée des Beanie Babies vs. Labubus ») et générer un résumé ou un rapport de recherche détaillé theverge.com.
- Achats et commandes : L’agent peut faire du shopping en ligne pour vous. Vous pouvez lui demander de trouver des produits selon certains critères, comparer des options, et même passer des commandes (avec votre autorisation) theguardian.com wired.com. Isa Fulford, responsable de la recherche chez OpenAI, a même demandé à l’agent de commander un lot de cupcakes en suivant ses instructions précises – une tâche qui « a pris presque une heure » mais qui lui a semblé plus facile que de le faire manuellement wired.com.
- Tâches bureautiques – Tableurs et présentations : Peut-être plus remarquable encore, ChatGPT Agent peut produire des fichiers modifiables. Il peut générer un tableau Excel ou un diaporama PowerPoint à partir de zéro selon votre demande openai.com. Par exemple, vous pourriez lui demander d’analyser des données sur vos concurrents et de créer un diaporama avec des graphiques résumant les résultats openai.com. Il peut également mettre à jour des tableaux avec de nouvelles données ou convertir un ensemble de captures d’écran en une présentation formatée openai.com. Les fichiers générés sont téléchargeables et destinés à être ouverts dans des logiciels bureautiques standards (bien que OpenAI précise que la fonction de génération de diaporamas est encore en version bêta) openai.com.
- Utiliser des outils développeur et des API : En coulisses, l’agent a accès à un terminal de programmation et peut appeler des API publiques. Cela signifie qu’il peut exécuter du code pour effectuer des calculs personnalisés ou interroger des services externes. Il peut s’intégrer à des applications comme Gmail ou GitHub via des « connecteurs », récupérant des informations (avec l’autorisation de l’utilisateur) à utiliser dans ses réponses openai.com. OpenAI indique que ChatGPT Agent peut même remplir des formulaires en ligne et interagir avec des services comme Google Drive ou SharePoint en effectuant des appels API wired.com.
Toutes ces capacités sont orchestrées en donnant à l’IA son propre « navigateur/ordinateur virtuel » pour travailler. Lorsque vous assignez une tâche, ChatGPT va naviguer sur des sites web, cliquer sur des liens ou des boutons, faire défiler des pages, remplir des champs de texte, écrire et exécuter du code, etc. – toutes les étapes nécessaires pour accomplir la mission openai.comtechmeme.com. Il fonctionne de manière itérative et autonome, décidant de l’outil ou du site à utiliser ensuite. Par exemple, planifier ce dîner japonais pourrait impliquer de chercher des recettes sur Google, puis d’ouvrir un site d’épicerie pour commander les ingrédients, et enfin de générer un tableau de courses – le tout réalisé par l’agent sans que l’utilisateur ait à gérer chaque étape.
Comment fonctionne ChatGPT Agent ?
Dans les coulisses, ChatGPT Agent est propulsé par un nouveau modèle d’IA qu’OpenAI a conçu spécifiquement pour les tâches d’agent, distinct du modèle de base GPT-4 theverge.com. Le modèle a été entraîné par apprentissage par renforcement pour gérer des tâches complexes nécessitant l’utilisation de plusieurs outils (comme des navigateurs, des API et du code) en séquence theverge.com. En fait, OpenAI a fusionné deux systèmes expérimentaux antérieurs – Operator (un outil de navigation/automatisation) et Deep Research (un outil d’analyse approfondie) – dans cet agent unifié. « Nous avons réalisé que les deux produits étaient très complémentaires, et avons donc décidé de fusionner les équipes, » explique Fulford wired.com. Le résultat est un agent qui combine la capacité d’Operator à naviguer sur le web avec l’aptitude de Deep Research à synthétiser l’information dans un seul flux de travail wired.com.
Boîte à outils de compétences : ChatGPT Agent est équipé de plusieurs outils spécialisés qu’il peut utiliser openai.com :
- Un navigateur visuel pour interagir avec les sites web via une interface graphique normale, comme le ferait un humain (cliquer sur des boutons, naviguer entre les pages).
- Un navigateur textuel pour envoyer rapidement des requêtes HTTP et analyser du texte brut (utile pour lire rapidement de grands textes ou lorsque le rendu visuel n’est pas nécessaire) openai.com.
- Un terminal/console qui lui permet d’exécuter du code, de manipuler des fichiers ou d’utiliser des utilitaires en ligne de commande dans son environnement sécurisé openai.com.
- Accès direct à l’API, lui permettant d’appeler les API de services externes (par exemple, publier sur Google Calendar, interroger une base de données ou récupérer des données d’un service en ligne) openai.com.
- Connecteurs aux comptes utilisateur : Les utilisateurs peuvent connecter leurs propres applications (comme l’e-mail ou GitHub). Avec leur permission, l’agent peut extraire des informations pertinentes de vos e-mails, de votre calendrier ou d’autres comptes pour accomplir des tâches openai.com. Par exemple, il peut parcourir votre Gmail à la recherche de messages récents si cela est nécessaire pour rédiger un résumé, ou vérifier votre calendrier via une API pour trouver des créneaux disponibles.
Ces outils permettent à l’IA de choisir l’approche optimale pour une tâche. Elle peut utiliser l’API pour vérifier rapidement la disponibilité de votre calendrier, puis passer au navigateur visuel pour naviguer sur une page de réservation OpenTable qui nécessite des clics et une interaction de type humain openai.com. Elle pourrait télécharger un fichier via le navigateur texte ou l’API, exécuter du code dessus dans le terminal pour l’analyser ou le reformater, puis ouvrir les résultats dans le navigateur visuel pour vous les présenter openai.com. Tout cela se passe dans la machine virtuelle de l’agent, isolée de votre appareil réel – c’est donc comme si l’IA avait son propre ordinateur pour exécuter vos instructions openai.com.
Expérience utilisateur : Pour l’utilisateur final, utiliser ChatGPT Agent est simple. La fonctionnalité est disponible via un nouveau « mode Agent » dans l’interface de ChatGPT pour ceux qui y ont accès openai.com. Il suffit de commencer une invite avec une tâche (vous pouvez aussi taper une commande slash « /agent ») et l’IA prend le relais theverge.com. Pendant qu’elle travaille, une narration à l’écran montre ce que fait l’agent étape par étape – par exemple, « Navigation vers maps.google.com… Recherche de “restaurants italiens près de chez moi”… » – afin que vous puissiez suivre openai.com openai.com. Il est à noter que vous pouvez interrompre ou orienter l’agent à tout moment : vous pouvez mettre le processus en pause pour clarifier vos instructions ou lui demander de prendre une autre approche, et il s’adaptera en cours de tâche sans perdre les progrès réalisés openai.com. Cette boucle collaborative vise à maintenir l’IA alignée sur vos objectifs.
Fonctionnalités de sécurité : Garder les actions de l’IA sous contrôle
Donner à une IA le pouvoir d’agir en ligne soulève évidemment des préoccupations de sécurité, et OpenAI reconnaît que ce nouveau mode comporte “plus de risques que les modèles précédents” theguardian.com. Pour atténuer ces risques, OpenAI a mis en place une série de garde-fous et de limitations :
- Autorisation de l’utilisateur pour les actions sensibles : “Vous gardez toujours le contrôle,” souligne OpenAI theguardian.com. ChatGPT Agent va demander une confirmation explicite avant d’effectuer toute action à conséquences sérieuses, comme effectuer un achat, envoyer un e-mail ou réserver une table en votre nom theguardian.com theverge.com. L’utilisateur doit approuver ces étapes irréversibles, empêchant ainsi l’IA de, par exemple, commander impulsivement pour 1 000 $ de gadgets sur Amazon à votre insu.
- Restrictions sur les contenus “à haut risque” (Bio/Chimie) : Compte tenu des capacités accrues de l’agent, OpenAI l’a classé dans la catégorie “Risque biologique et chimique élevé”, même s’ils n’ont “aucune preuve définitive” qu’il pourrait aider à créer une arme biologique theguardian.com theverge.com. Cette précaution (faisant partie du Preparedness Framework d’OpenAI) signifie que des garde-fous supplémentaires sont activés. Concrètement, OpenAI exécute un classificateur de contenu en temps réel sur chaque requête à l’agent pour vérifier si elle concerne la biologie ou la chimie, et si c’est le cas, la réponse de l’agent est vérifiée par un second modèle de sécurité pour s’assurer qu’elle ne fournit pas d’instructions dangereuses techcrunch.com techcrunch.com. Autrement dit, si quelqu’un tente d’utiliser l’agent pour, par exemple, fabriquer une substance toxique, le système est conçu pour le détecter et le bloquer.
- Formé pour refuser les tâches nuisibles : L’agent a été entraîné à rejeter certaines demandes suspectes ou malveillantes. Par exemple, il refusera s’il est invité à effectuer quelque chose d’évidemment dangereux ou contraire à l’éthique, comme réaliser un virement bancaire vers un compte inconnu ou exécuter des commandes destructrices theguardian.com. OpenAI indique que des red-teamers et des experts du domaine ont aidé à tester le système contre des « scénarios réalistes » pour renforcer ces refus openai.com.
- Mémoire à long terme désactivée : Une limitation intéressante – la mémoire de chat à long terme de ChatGPT est désactivée en mode agent techcrunch.com. Normalement, ChatGPT peut se souvenir d’informations provenant d’une conversation précédente ou de sessions antérieures (si activé), mais OpenAI craignait qu’un attaquant ingénieux puisse exploiter cela lors de tâches d’agent (via ce qu’on appelle des injections de prompt) pour amener l’agent à divulguer des données sensibles ou à effectuer des actions non souhaitées techcrunch.com. En conséquence, l’agent fonctionne actuellement sans état, sans conserver d’informations des discussions précédentes. OpenAI pourrait réactiver la mémoire à l’avenir une fois qu’ils seront certains que c’est sûr, mais pour l’instant cette « précaution supplémentaire » permet d’éviter d’éventuelles fuites de données wired.com.
- Transactions financières interdites : OpenAI a également restreint les opérations financières pour le moment. L’agent n’exécutera pas de transferts d’argent ni d’achats/ventes d’actions, par exemple, même si on lui demande theverge.com. En fait, il existe une protection appelée « Watch Mode » qui s’active si l’agent navigue sur certains sites sensibles (comme des banques ou des plateformes de trading) – il mettra son activité en pause si l’utilisateur quitte l’onglet du navigateur de l’agent, afin d’éviter toute action sournoise en arrière-plan theverge.com.
- Tests approfondis et programme de primes : OpenAI affirme que ce modèle dispose de leur « pile de sécurité la plus complète à ce jour » en matière de modélisation des menaces et de surveillance openai.com openai.com. Ils ont collaboré avec des experts en biosécurité externes et fait appel à des spécialistes du domaine pour red-team l’agent avant le lancement openai.com. Parallèlement à la sortie, OpenAI a également publié une system card détaillée expliquant les risques et propose une bug bounty pour encourager les chercheurs externes à signaler les vulnérabilités openai.com openai.com.
Malgré ces précautions, OpenAI sait que des comportements inattendus peuvent encore émerger lorsqu’une IA opère sur l’internet ouvert. L’entreprise indique qu’elle affinera l’agent de manière itérative et ajustera les mesures de sécurité si nécessaire. Pour l’instant, il est conseillé aux utilisateurs de superviser les actions de l’agent (l’interface encourage cela en commentant chaque étape). « Avec ce modèle, il y a plus de risques qu’avec les modèles précédents, » admet OpenAI, c’est pourquoi ils « font preuve de prudence et mettent en place les mesures de sécurité nécessaires dès maintenant » theguardian.com theguardian.com.
Limites initiales : vitesse et fiabilité
Ne licenciez pas encore votre assistant humain. Lors des premières démonstrations et tests, ChatGPT Agent a montré des capacités impressionnantes mais aussi des limites notables :
- Lent et régulier : L’agent met souvent du temps à accomplir les tâches. Il peut passer plusieurs minutes à cliquer et à naviguer pour rassembler des informations, bien plus longtemps qu’une réponse directe d’un chatbot. Lors d’une démonstration, le fait de faire passer l’agent au crible d’un Google Agenda et de sites de restaurants pour suggérer des options de dîner a pris environ 10–15 minutes theguardian.com. Générer une présentation complexe ou mener des recherches approfondies peut prendre encore plus de temps (le personnel d’OpenAI a noté qu’une tâche de création de diapositives a pris environ 25 minutes lors des tests) wired.com. « Même si cela prend 15 minutes, une demi-heure, c’est déjà un gain de temps considérable par rapport à ce qu’il vous faudrait pour le faire vous-même », fait valoir Fulford, soulignant que les utilisateurs peuvent lancer une tâche puis faire autre chose pendant que l’agent travaille theverge.com. Il faut tout de même faire preuve de patience ; l’agent n’est pas instantané. Yash Kumar d’OpenAI estime qu’une tâche moyenne prend environ 10–15 minutes dans la version actuelle wired.com.
- Quelques ratés occasionnels : Comme tout système d’IA, l’agent peut faire des erreurs ou rester « bloqué » sur une tâche. Les premiers utilisateurs ont rapporté des résultats mitigés. Certains flux de travail complexes peuvent le dérouter, ou il peut mal interpréter une instruction en cours de route. Un des premiers testeurs a commenté que l’agent « a échoué sur les trois tâches différentes que je lui ai données… Un bel aperçu du futur, mais pas encore vraiment utile. »techmeme.com. Cela souligne que la technologie, bien qu’avancée, est loin d’être infaillible. OpenAI elle-même note que l’agent est « encore à ses débuts » et « peut encore faire des erreurs. » openai.com De futures mises à jour devraient améliorer sa fiabilité et son raisonnement.
- Qualité de sortie de base : La fonctionnalité de génération de PowerPoint/diapositives est actuellement en bêta, ce qui signifie que les diapositives créées peuvent sembler assez simples ou nécessiter des retouches openai.com. OpenAI s’est d’abord concentré sur l’exactitude du contenu et de la structure, plutôt que sur un design tape-à-l’œil. Ils préviennent que la mise en forme peut être rudimentaire et qu’il existe parfois des écarts entre l’aperçu de la diapositive et le fichier PowerPoint exporté openai.com. De même, bien que l’agent puisse éditer des feuilles de calcul et maintenir des formules, il n’est pas encore un expert Excel au niveau d’un humain qualifié. OpenAI forme déjà la prochaine version pour produire des « résultats plus soignés et sophistiqués » dans les présentations openai.com.
- Pas de lancement européen (pour l’instant) : Il est à noter que ChatGPT Agent n’a pas été lancé dans l’UE. OpenAI « travaille encore à permettre l’accès pour l’Espace économique européen et la Suisse » openai.com. Les utilisateurs d’ailleurs (y compris aux États-Unis et au Royaume-Uni) ont eu un accès immédiat, mais les utilisateurs européens doivent attendre indéfiniment. OpenAI n’a pas donné de calendrier précis pour le déploiement dans l’UE theverge.com. Cela est probablement lié à des préoccupations réglementaires – les réglementations strictes de l’UE sur les données et l’IA peuvent exiger des étapes de conformité supplémentaires de la part d’OpenAI avant de déployer un agent autonome. Pour l’instant, les Européens ne voient qu’un message indiquant que la fonctionnalité n’est pas disponible dans leur région.
Du côté positif, OpenAI affirme que le nouveau modèle sous-jacent de l’agent est bien plus performant que les versions précédentes, ce qui est de bon augure pour la gestion de la complexité. Le modèle aurait obtenu des scores à la pointe de la technologie sur plusieurs benchmarks difficiles techcrunch.com. Par exemple, il a obtenu un score de 41,6 % à « Humanity’s Last Exam », un test massif de niveau expert couvrant plus de 100 sujets – soit environ le double du score des modèles précédents d’OpenAI à ce test techcrunch.com. Sur un benchmark de mathématiques notoirement difficile (FrontierMath), il a atteint 27,4 % de précision avec l’utilisation d’outils, contre seulement 6,3 % pour le meilleur modèle antérieur techcrunch.com. Ces améliorations suggèrent que l’agent est bien meilleur pour résoudre des problèmes complexes et à étapes multiples lorsqu’il peut utiliser des outils. « OpenAI affirme que l’agent ChatGPT est bien plus performant que ses offres précédentes, » rapporte TechCrunch techcrunch.com – mais tant que davantage d’utilisateurs ne l’auront pas poussé à ses limites dans des scénarios réels, il reste à voir à quel point il est réellement “performant” en dehors des tests contrôlés techcrunch.com.
Disponibilité : Qui peut utiliser l’agent ChatGPT ?
OpenAI déploie initialement l’agent ChatGPT comme un avantage réservé aux abonnés payants uniquement. Dès cette semaine, la fonctionnalité est activée pour les utilisateurs des offres ChatGPT Pro, Plus et Team (à peu près équivalentes aux niveaux premium) techcrunch.com. Les utilisateurs Pro devaient y avoir accès en premier (le jour du lancement), suivis par les abonnés Plus et Team dans les jours suivants openai.com. Les clients des offres Enterprise et Education l’obtiendront « dans les semaines à venir » une fois les derniers ajustements effectués openai.com theverge.com. Il n’y a aucun calendrier annoncé pour les utilisateurs gratuits afin de bénéficier des capacités de l’agent – et il est possible que cela reste une fonctionnalité payante pour un avenir prévisible, compte tenu de la valeur ajoutée et des coûts de calcul élevés impliqués.
En plus de l’accès par niveaux, OpenAI a imposé des limites d’utilisation mensuelles. Les abonnés Pro (le niveau le plus élevé) peuvent exécuter jusqu’à 400 tâches d’agent par mois, tandis que les utilisateurs Plus et Team bénéficient de 40 tâches par mois incluses wired.com wired.com. Ce plafond garantit que les opérations coûteuses ne deviennent pas incontrôlées, mais une utilisation supplémentaire peut être achetée via un système de crédits si les utilisateurs en ont besoin openai.com. Les tâches sont comptabilisées par “invite agentique”, c’est-à-dire qu’à chaque fois que vous activez l’agent pour faire quelque chose, cela compte pour une tâche.
Comme mentionné, les utilisateurs européens ne peuvent pas accéder à ChatGPT Agent au lancement theguardian.com. Lorsque les utilisateurs hors UE activent le mode agent, ils sont avertis du caractère expérimental de la fonctionnalité puis peuvent continuer. Les utilisateurs de l’UE, en revanche, sont simplement bloqués. La note d’OpenAI indiquant qu’elle travaille sur l’accès à l’EEE suggère que le blocage est probablement lié à la conformité avec la réglementation européenne (peut-être en lien avec la confidentialité et l’AI Act). Ce déploiement géorestreint rappelle la façon dont certaines fonctionnalités précédentes de ChatGPT (comme la navigation web) ont été temporairement retenues dans certaines régions en raison d’incertitudes juridiques. Pour l’instant, toute personne dans l’UE devra attendre qu’OpenAI s’assure que l’agent respecte les exigences locales.
Une course à l’armement des agents IA – Google, Anthropic & autres
L’offensive d’OpenAI dans l’IA “agentique” intervient dans un contexte de tendance sectorielle vers des assistants IA autonomes. En fait, les concurrents préparent leurs propres fonctionnalités de type agent :
- Claude d’Anthropic : L’an dernier, Anthropic (créateur du chatbot Claude) a introduit une capacité appelée “Computer Use” – donnant essentiellement à Claude la capacité d’utiliser un ordinateur comme un humain, par exemple en naviguant sur des sites web et en effectuant des tâches sur la machine d’un utilisateur theverge.com. Il y a seulement deux mois (mai 2025), Anthropic a lancé son dernier modèle Claude 2 (nom de code Opus 4) avec des fonctionnalités agentiques et a également activé des mesures spéciales de biosécurité pour prévenir les abus theverge.com. Cela montre que même les jeunes pousses de l’IA sont conscientes à la fois de la puissance et des risques des agents autonomes.
- Extensions d’IA de Google : Google travaille à intégrer son IA générative (comme Bard et Assistant) avec des actions directes. Ils ont fait la démonstration d’une IA capable de rédiger des e-mails dans Gmail, de résumer des documents dans Google Drive, et même de contrôler un navigateur via leur expérimental « Duet AI » pour Workspace. The Guardian note que Google a récemment lancé des « agents » assistants similaires capables de jongler entre les applications pour accomplir des tâches pour l’utilisateur theguardian.com. De plus, la semaine dernière, Google a embauché des membres clés d’une startup (Windsurf) spécifiquement pour renforcer ses projets d’IA agentique theverge.com, soulignant la course à la concurrence pour créer des assistants façon Jarvis.
- Autres acteurs : Meta (Facebook) et Amazon ont également évoqué leurs ambitions d’agents IA lors de leurs appels de résultats, indiquant que tous les géants de la tech voient cela comme la prochaine grande étape theverge.com. Par exemple, les entreprises de e-commerce imaginent des agents IA capables de gérer de bout en bout les discussions de service client ou les demandes d’achat. Dans un exemple marquant, la fintech Klarna a rapporté début 2024 que son agent IA de service client a géré deux tiers de tous les chats clients, accomplissant le travail d’environ 700 humains theverge.com. Ce succès a contribué à populariser le terme « agent IA » dans les milieux d’affaires, et depuis, de nombreux PDG vantent l’IA basée sur des agents comme objectif theverge.com.
- Expériences passées : OpenAI elle-même s’est déjà essayée aux agents auparavant. En janvier 2025, elle a publié Operator en aperçu de recherche, décrit comme « un agent qui peut aller sur le web pour effectuer des tâches pour vous » theverge.com. Operator pouvait cliquer et faire défiler des sites web. Il y avait aussi le mode Deep Research qui pouvait rédiger des analyses longues. Ces précurseurs, cependant, étaient limités dans leur portée et parfois fragiles. D’autres startups (comme ACT-1 d’Adept AI) ont montré des agents capables d’exécuter des commandes dans des logiciels comme un humain, mais aucun n’est encore devenu un produit grand public. Les premières générations d’agents IA avaient du mal avec les tâches complexes et la fiabilité techcrunch.com – nécessitant souvent beaucoup d’assistance. Les dirigeants tech présentaient des visions d’assistants IA capables de tout faire, mais la réalité était en retard sur le battage médiatique techcrunch.com.
Aujourd’hui, avec ChatGPT Agent, OpenAI tente de dépasser ces efforts précédents. En combinant les points forts (navigation web + analyse) et en utilisant l’intelligence de niveau GPT-4, ils affirment avoir enfin un agent qui s’approche de la grande vision. « C’est la meilleure expérience utilisateur pour un agent jamais vue. ABSOLUMENT FOU. ESSAYEZ DE FAIRE MIEUX !! » a posté un utilisateur enthousiaste après le lancementtechmeme.com. Bien que ce sentiment soit évidemment exagéré, il reflète l’enthousiasme de certains milieux de la communauté IA à l’idée que nous nous rapprochons d’un « J.A.R.V.I.S. » – le majordome IA fictif d’Iron Man – dans la vraie vie theverge.com. Pour l’instant, ChatGPT Agent et ses pairs ne sont encore que des premiers pas vers cet idéal, gérant surtout la recherche, le codage et des tâches en ligne basiques plutôt qu’une autonomie vraiment ouverte theverge.com. Mais la dynamique concurrentielle est indéniable : chaque entreprise d’IA veut être la première à créer l’assistant IA que les gens utiliseront réellement au quotidien.
Monétisation : Les agents rapporteront-ils de l’argent à OpenAI ?
Avec le lancement de ChatGPT Agent, OpenAI ne fait pas que présenter une nouvelle technologie – elle vise aussi de potentiels flux de revenus. L’entreprise a fortement subventionné le développement de ChatGPT (avec Microsoft investissant des milliards), et doit transformer son IA extrêmement populaire en un « produit rentable » wired.com. Les agents pourraient être la clé de cette monétisation de plusieurs façons :
- Incitation à l’abonnement : En résumé, le mode agent est une fonctionnalité premium qui pourrait inciter davantage d’utilisateurs à souscrire à des offres payantes. En le limitant aux abonnés Plus/Pro, OpenAI rend les 20 $ (ou plus) par mois plus attractifs pour les utilisateurs avancés qui souhaitent déléguer du travail à un assistant IA. C’est la monétisation immédiate et directe : faire payer plus de personnes pour l’accès à ChatGPT.
- Frais de transaction : Le PDG d’OpenAI, Sam Altman, a laissé entendre qu’il pourrait percevoir des commissions sur le commerce réalisé via son IA. Il a évoqué la possibilité qu’OpenAI « facture des frais de 2 % sur les ventes générées » grâce aux actions de son assistant theguardian.com. En d’autres termes, si ChatGPT Agent vous aide à acheter un produit ou à réserver un hôtel, OpenAI pourrait prélever une petite commission (auprès du commerçant ou via des liens d’affiliation). Ce modèle transformerait les achats ou réservations assistés par IA en source de revenus. La récente démonstration de l’agent, le montrant guider un utilisateur vers des paiements en ligne, a immédiatement alimenté les spéculations sur une possible intégration future de tels frais d’affiliation ou de recommandation theguardian.com.
- Résultats sponsorisés/publicités : Les assistants IA pourraient devenir une nouvelle plateforme publicitaire. Si un agent suggère des produits ou des restaurants, les marques paieront-elles pour être recommandées ? « Une forme de publicité ou de placement sponsorisé semble inévitable, » observe l’analyste Niamh Burns, notant la « pression croissante [sur les entreprises d’IA] pour monétiser leurs produits. » theguardian.com Il existe un précédent : les moteurs de recherche gagnent de l’argent grâce à la publicité, donc une IA qui remplace la recherche pourrait en faire autant. Cependant, OpenAI nie tout usage actuel de contenu sponsorisé dans les recommandations de ChatGPT Agent theguardian.com. Ils ont déclaré que l’agent n’inclut pas de placements de produits payants, et « il n’est pas prévu de changer cela. » theguardian.com Pour l’instant, les résultats sont censés être uniquement basés sur les critères de l’utilisateur et le jugement de l’IA. Néanmoins, la porte reste ouverte à de futurs modèles publicitaires une fois l’écosystème des assistants arrivé à maturité.
- Services aux entreprises : OpenAI pourrait également monétiser en proposant l’agent dans le cadre de solutions logicielles pour entreprises. Par exemple, des sociétés pourraient payer pour intégrer ChatGPT Agent à leurs outils internes ou pour qu’il gère le support client. OpenAI est déjà en négociations contractuelles avec Microsoft concernant la poursuite du partenariat, et on peut imaginer des agents avancés intégrés aux offres de Microsoft (ce qui pourrait indirectement générer des revenus ou des conditions favorables pour OpenAI) wired.com. Les « cas d’utilisation en entreprise » ont été un point clé dans la conception de l’agent, selon le chef de produit Yash Kumar wired.com, ce qui signifie qu’OpenAI réfléchit probablement à la manière dont les entreprises peuvent exploiter (et payer pour) cette technologie.
À court terme, OpenAI va probablement se concentrer sur l’amélioration de l’agent et l’augmentation des abonnements. Mais à terme, si les agents deviennent aussi utiles que promis, ils pourraient faciliter des transactions ou des flux de travail entiers – et OpenAI cherchera certainement à en tirer une partie de la valeur. L’entreprise doit trouver un équilibre entre la confiance des utilisateurs (un agent qui recommande des produits doit sembler impartial pour être digne de confiance) et la monétisation. La façon dont elle s’y prendra sera scrutée de près. Comme l’analyste Burns s’interrogeait : si un agent trouve des produits pour vous, « qu’est-ce qui entre en jeu dans le processus de recherche de ces produits par le système ? Y aura-t-il des accords commerciaux où des marques paient pour être mises en avant par les assistants… ? » theguardian.com. OpenAI affirme que ce n’est pas le cas pour l’instant, mais l’incitation économique existe.
Réactions d’experts et perspectives
Le lancement de ChatGPT Agent a suscité à la fois de l’enthousiasme et des commentaires prudents de la part des experts et des premiers utilisateurs. Ethan Mollick, professeur à Wharton connu pour ses expérimentations de l’IA dans l’éducation, faisait partie d’un petit groupe ayant eu un accès anticipé. Son verdict est positif : « ChatGPT agent est, je pense, un grand pas en avant pour amener les IA à effectuer de vrais travaux. Même à ce stade, il fait un bon travail en réalisant de façon autonome des recherches et en assemblant des fichiers Excel (avec formules !), PowerPoint, etc. »techmeme.com. Mollick a déclaré que cela donnait un aperçu de la façon dont les différentes capacités d’agent « convergent », même si ce n’est pas encore parfaittechmeme.com. D’autres chercheurs en IA ont partagé ce sentiment, impressionnés par la capacité de ChatGPT Agent à enchaîner les tâches et à produire des résultats exploitables qui nécessitaient auparavant de nombreuses étapes manuelles.
En même temps, on reconnaît que les tests en conditions réelles viennent tout juste de commencer. À quel point l’agent gère de manière fiable l’internet ouvert et chaotique, s’il peut éviter de tomber dans des arnaques ou de la désinformation en naviguant, et dans quelle mesure les utilisateurs moyens le trouvent réellement utile – ce sont des questions encore ouvertes. « Il reste à voir à quel point il est réellement capable dans le monde réel, » a noté TechCrunch, étant donné que les agents précédents étaient fragiles face à des scénarios inattendus techcrunch.com. Il y a aussi la préoccupation sociétale plus large de confier plus d’autonomie à l’IA : même avec des vérifications d’autorisation, des histoires d’IA prenant des décisions étranges ou risquées ne manqueront pas d’apparaître. La propre fiche système d’OpenAI reconnaît « des risques nouveaux » liés à une telle autonomie et promet des recherches continues pour les atténuer openai.com openai.com.
Pour l’instant, l’introduction de ChatGPT Agent représente une étape importante dans la progression de l’IA, passant de la génération de texte purement assistée à l’exécution réelle de tâches. Cela fait partie d’un changement de paradigme : on passe des « chatbots » aux « agents » – des systèmes d’IA capables de prendre des initiatives et d’atteindre des objectifs dans le monde numérique, et pas seulement de converser. « Agent est le mot à la mode par excellence en ce moment, » écrit WIRED, précisément parce que tant d’entreprises poursuivent cette vision wired.com. OpenAI a planté son drapeau fermement sur ce nouveau territoire, s’appuyant sur la popularité et la familiarité de ChatGPT pour proposer un agent au grand public (ou du moins au public payant).
En résumé : Si vous êtes un utilisateur éligible de ChatGPT, vous pouvez désormais déléguer certaines tâches fastidieuses ou complexes à un assistant IA et le regarder les accomplir étape par étape. Cela peut sembler un peu magique – comme avoir un stagiaire assidu qui ne dort jamais – et aussi un peu inquiétant de voir l’IA parcourir le web de façon autonome. Ce lancement marque le début d’une grande expérience sur la façon dont les gens ordinaires pourraient utiliser des agents IA. Comme l’a dit un des premiers utilisateurs : « [Il] fait du bon travail de façon autonome… Cela donne une idée de la façon dont les agents se mettent en place. »techmeme.com Dans les mois à venir, nous verrons si ChatGPT Agent tient réellement sa promesse de commodité et de productivité, et comment il se positionne face au nombre croissant d’assistants IA concurrents. Une chose est sûre : l’ère de l’IA qui agit, et pas seulement qui discute, a officiellement commencé.
Sources :
- Booth, R. (2025, 17 juillet). The Guardian – OpenAI lance un assistant personnel capable de contrôler des fichiers et des navigateurs web. theguardian.com theguardian.com theguardian.com theguardian.com theguardian.com
- OpenAI. (2025, 17 juillet). Présentation de ChatGPT Agent : Relier la recherche et l’action (Blog officiel d’OpenAI) openai.com openai.com openai.com openai.com
- Field, H. (2025, 17 juillet). The Verge – Le nouvel Agent ChatGPT d’OpenAI peut contrôler un ordinateur entier et effectuer des tâches pour vous. theverge.com theverge.com theverge.com theverge.com Zeff, M. (2025, 17 juillet). TechCrunch – OpenAI lance un agent à usage général dans ChatGPT. techcrunch.com techcrunch.com techcrunch.com techcrunch.com
- Rogers, R. (2025, 17 juillet). WIRED – Le nouvel agent ChatGPT d’OpenAI essaie de tout faire. wired.com wired.com wired.com wired.com
- Techmeme. (2025, 17 juillet). Actualités technologiques agrégées sur le lancement de ChatGPT Agent (y compris le commentaire d’Ethan Mollick)techmeme.com