Aller au contenu principal
SaaS

Le terme « agent IA » est-il galvaudé en 2026 ? Audit critique des usages

Wrappers ChatGPT, plateformes no-code, code assistants, frameworks d'orchestration : tout se présente comme agent IA. Confrontation des définitions académiques aux produits réels du marché.

Co-fondateur Swoft
Tableau de comparaison de produits agents IA

En 2024-2026, le marché tech a basculé. Tout est devenu agent. Les éditeurs SaaS ajoutent un agent à leur produit. Les plateformes no-code se rebaptisent agentic platforms. Les startups lèvent sur des slides où le mot revient une fois par bullet. Et les utilisateurs, eux, ne savent plus distinguer ce qui mérite vraiment cette étiquette de ce qui s'en pare opportunistement. Cet article propose un audit méthodique : on prend les principales catégories de produits qui se réclament d'agent IA, et on les confronte aux quatre propriétés posées par Wooldridge en 1995.

Rappel des quatre critères

Pour qu'un système mérite le nom d'agent au sens fort, il doit cumuler quatre propriétés : autonomie (il décide sans intervention humaine directe), réactivité (il perçoit et réagit à son environnement), pro-activité (il prend l'initiative pour atteindre son objectif), capacité sociale (il interagit avec d'autres agents). Si une seule de ces propriétés manque, le système peut être très utile, mais il n'est pas un agent au sens académique.

Catégorie 1, Les wrappers LLM (custom GPTs, prompts longs)

C'est la catégorie la plus large et la plus naïve. Un custom GPT, un prompt système long, un assistant Claude personnalisé : tous fonctionnent sur le même schéma. L'utilisateur tape une requête, le LLM répond en suivant les instructions de son prompt système. Il peut éventuellement appeler quelques outils (recherche web, exécution de code) pour enrichir sa réponse.

Vérifions. Autonomie : non, chaque tour requiert une nouvelle requête utilisateur. Réactivité : limitée, le système ne réagit qu'à ce que l'utilisateur lui envoie, pas à des changements dans un environnement extérieur. Pro-activité : absente, il ne prend jamais l'initiative. Capacité sociale : limitée à l'utilisateur unique qui l'interroge. Verdict : ce sont des assistants conversationnels, pas des agents.

Catégorie 2, Les plateformes workflow (Make, n8n, Zapier)

Avec l'essor de l'IA, ces plateformes ont introduit des nodes IA et se positionnent désormais sur le marché des agents. Un workflow type : un trigger (nouveau mail), un node IA qui analyse le contenu, un node de décision, des nodes d'action (créer une entrée dans une base, envoyer un message Slack). L'argumentaire commercial parle volontiers d'agents qui automatisent vos tâches.

Vérifions. Autonomie : partielle, le workflow s'exécute sans humain une fois déclenché, mais le périmètre d'autonomie est étroit (les branches du workflow). Réactivité : oui, réagit aux triggers. Pro-activité : non, ne s'auto-déclenche jamais hors d'un trigger défini. Capacité sociale : très limitée, pas de communication entre instances de workflow. Verdict : ce sont des automatisations sophistiquées avec une couche IA. Le terme agent est utilisé pour le marketing.

Catégorie 3, Les code assistants (Cursor, Cline, Aider, Claude Code)

Ce sont les produits les plus avancés du marché grand public. Cursor en mode composer, Cline, Aider en mode autopilot, Claude Code : tous peuvent recevoir une instruction de haut niveau (« implémente cette feature »), explorer le code, modifier plusieurs fichiers, exécuter des tests, itérer en cas d'erreur, et livrer un résultat exploitable.

Vérifions. Autonomie : oui pendant la session, le code assistant prend des décisions techniques sans demander à chaque pas. Réactivité : oui, il réagit aux erreurs de compilation, aux échecs de tests. Pro-activité : oui en partie, il peut décider d'ajouter une dépendance, de refactorer, sans que l'humain l'ait explicitement demandé. Capacité sociale : faible, pas de communication structurée avec d'autres agents.

Verdict : oui, ce sont des agents au sens Wooldridge. Mais des agents mono-tâche, sans persistence, sans organisation. La session se termine, l'agent disparaît avec elle. Et surtout : leur autonomie n'a aucune borne architecturale. Ils peuvent en théorie modifier n'importe quel fichier, lancer n'importe quelle commande. C'est précisément ce qui les rend puissants, et risqués en production.

Catégorie 4, Les frameworks d'orchestration (LangChain, CrewAI, AutoGen, LangGraph)

Ces frameworks proposent de construire des systèmes multi-agents en assemblant des LLM qui se parlent, se passent des tâches, votent, débattent. CrewAI introduit la notion de crew (un manager, des workers). AutoGen propose des conversations entre agents avec un human-in-the-loop optionnel. LangGraph modélise tout en graphe d'états.

Vérifions. Autonomie : oui, chaque agent du système prend des décisions. Réactivité : oui. Pro-activité : oui. Capacité sociale : oui, c'est même le point central. Verdict : ce sont des agents au sens Wooldridge. Mais, et c'est un mais important, ce ne sont pas des systèmes multi-agents au sens de Ferber. Pourquoi ? Parce qu'il leur manque la dimension organisationnelle.

Catégorie 5, Les plateformes commerciales (Salesforce Agentforce, Microsoft Copilot Agents)

Salesforce Agentforce, lancé en 2024, propose des agents préconfigurés pour des tâches commerciales : qualification de leads, planification de rendez-vous, support client. Microsoft a suivi avec Copilot Agents intégré dans la suite Office et Dynamics. Ces plateformes promettent des agents sur étagère, configurables sans code, et déployables en quelques clics.

Vérifions. Autonomie : oui dans un périmètre étroit, l'agent peut envoyer un mail, créer une opportunité, planifier un appel. Réactivité : oui. Pro-activité : limitée, l'agent attend généralement des triggers (nouveau lead entrant, demande client). Capacité sociale : faible, peu d'interaction inter-agents structurée. Verdict : techniquement des agents Wooldridge, mais à très faible profondeur. La promesse marketing dépasse souvent la réalité fonctionnelle.

Le test simple qui tranche

Au-delà de ces critères académiques, il existe un test pragmatique qui résume le tout : « L'agent peut-il refuser de répondre à un humain pour finir sa tâche en cours ? » Cette question saisit les quatre propriétés Wooldridge en une seule. Un agent autonome a une tâche assignée. Un agent réactif perçoit qu'un humain l'interroge. Un agent pro-actif décide en fonction de son objectif. Un agent socialement compétent négocie sa réponse avec l'humain (« je termine d'abord ceci, je reviens vers vous »).

Appliquons ce test aux cinq catégories. Wrapper LLM : non, il répond systématiquement. Plateforme workflow : non, ne tient pas de tâche persistante. Code assistant : parfois, il peut refuser un changement utilisateur s'il viole un test. Framework orchestration : techniquement oui, mais l'humain reste la couche d'arbitrage. Plateforme commerciale : non, l'agent priorise toujours l'humain. Conclusion : à peine 5 % des produits dits agents IA en 2026 passent ce test.

Conclusion : galvaudé, oui, mais pas inutilisable

Le terme agent IA est galvaudé. Une part écrasante des produits qui s'en réclament n'en sont pas, au sens académique. Cela ne veut pas dire que ces produits sont mauvais, beaucoup sont excellents pour leur usage. Mais ils ne sont pas des agents. Ce sont des assistants, des automatisations, des wrappers, des orchestrateurs.

Que faire ? Deux options. Soit on accepte que le mot ait perdu son sens et on l'utilise comme synonyme d'« IA qui fait quelque chose », ce qui est commercialement pratique mais intellectuellement creux. Soit on précise systématiquement à quel niveau d'autonomie on parle, et on garde la rigueur de Wooldridge pour les cas où elle compte vraiment, c'est-à-dire en production critique, sur des décisions à conséquence, dans des secteurs régulés.

C'est cette deuxième voie que nous recommandons. Et c'est aussi pour ça que nous avons publié une cartographie des cinq degrés d'autonomie possibles pour un agent IA, qui permet de positionner précisément un produit sur le spectre du wrapper LLM au système Wooldridge complet.

Sources et lectures complémentaires

  1. [1]Wooldridge & Jennings, Intelligent agents: theory and practice (Knowledge Engineering Review, 1995), Définition séminale de l'agent autonome : critère de référence pour distinguer un vrai agent d'un chatbot.
  2. [2]Russell & Norvig, Artificial Intelligence: A Modern Approach, 4th ed. (2020), Cadre de référence standard sur les agents rationnels en IA.
  3. [3]Cemri et al., Why Do Multi-Agent LLM Systems Fail? (arXiv:2503.13657, 2025), Diagnostic critique des prétendus agents IA actuels : 14 modes d'échec récurrents.

Sujets abordés

  • Agent IA
  • Wooldridge
  • Ferber
  • Audit critique
  • LangChain
  • CrewAI
  • AutoGen
  • LangGraph
  • Cursor
  • Salesforce Agentforce
  • Définition rigoureuse

À approfondir dans le glossaire

Traduction technologique

Comment Swoft traduit cet enjeu en logiciel

Comment Swoft applique le test de Wooldridge à ses propres agents, et pourquoi il refuse de qualifier d'agents les composants qui n'en sont pas.

  1. 01

    Pas de wrapper LLM appelé agent

    Les composants Swoft qui font de l'inférence LLM sans satisfaire les quatre propriétés Wooldridge ne sont jamais nommés agents. On les appelle services LLM, classifieurs, ou extracteurs.

  2. 02

    13 agents nominatifs, pas plus

    Notre plateforme expose 13 agents persona, chacun rattaché à un bounded context, avec son périmètre, ses outils, ses règles d'escalation. Les autres composants IA, plus modestes en autonomie, ne s'appellent pas agents.

  3. 03

    Test de Ferber appliqué

    Pour chacun des 13 agents, la question « qui décide en cas de conflit ? » a une réponse structurelle : la table de routage Conway et les seuils de confiance. C'est ce qui rend le système réellement multi-agents au sens Ferber.

  4. 04

    Refus structurel possible

    Un agent Swoft peut refuser une commande humaine si elle viole une contrainte de son bounded context. Pas par politesse, par architecture. C'est précisément ce que le test « peut-il refuser ? » exige.

Solution sectorielle

Logiciel sur-mesure pour le secteur saas

Voyez comment Swoft livre des applications métier pour le secteur saas : méthode, intégrations, exemples de ROI.

Voir le secteur saas
Proximité éditoriale

Pour aller plus loin sur ce sujet

  • Qu'est-ce qu'un agent IA ? Retour sur 70 ans de recherche académique
    Schéma d'agent IA percevant son environnement et agissant dessus
    SaaS

    Qu'est-ce qu'un agent IA ? Retour sur 70 ans de recherche académique

    ChatGPT n'est pas un agent au sens académique. Russell, Norvig, Wooldridge et Ferber proposent depuis 30 ans une définition exigeante que la plupart des produits 2026 ne tiennent pas. État de la question.

  • Ce que Swoft entend par « agent IA » : Wooldridge plus contraintes architecturales
    Architecture d'un agent IA avec périmètre borné et traçabilité
    SaaS

    Ce que Swoft entend par « agent IA » : Wooldridge plus contraintes architecturales

    La définition Swoft applique strictement les quatre propriétés de Wooldridge, et y ajoute trois contraintes architecturales qui rendent l'agent fiable en production : périmètre borné, traçabilité native, identité organisationnelle.

  • Systèmes multi-agents : de Ferber à Conway's Law exécutable
    Système multi-agents avec rôles organisationnels
    SaaS

    Systèmes multi-agents : de Ferber à Conway's Law exécutable

    Jacques Ferber a écrit Les systèmes multi-agents en 1995. Trente ans plus tard, sa dimension organisationnelle, souvent oubliée par les frameworks contemporains, devient productionnable grâce à l'architecture événementielle.

Même secteur

Continuer la lecture, SaaS

  • NIS2 pour les éditeurs SaaS : six mois pour passer l'audit
    Salle serveur d'un éditeur SaaS avec consoles de supervision sécurité

    NIS2 pour les éditeurs SaaS : six mois pour passer l'audit

    Applicable depuis octobre 2024, la directive NIS2 commence à mordre en 2026. Les éditeurs SaaS classés « entité importante » font face à des exigences techniques nouvelles.