← Retourner à la liste des articles
Image blog
Auteur

Par Maxime Jumelle

CTO & Co-Founder

Publié le 27 nov. 2025

Catégorie Agentic AI

Agent ReAct : définitions et exemples

Les agents IA représentent aujourd'hui une avancée majeure dans le domaine de l'intelligence artificielle. Parmi les différentes architectures disponibles, l'agent ReAct (Reasoning and Acting) s'est imposé comme une approche particulièrement efficace pour résoudre des tâches complexes nécessitant à la fois réflexion et action.

Contrairement aux LLM traditionnels qui se contentent de générer du texte, les agents ReAct sont capables d'interagir avec leur environnement, d'utiliser des outils externes et d'adapter leur comportement en fonction des résultats obtenus. Cette capacité à raisonner et agir de manière itérative ouvre des perspectives considérables pour l'automatisation de tâches complexes.

Dans cet article, nous allons explorer en détail le fonctionnement des agents ReAct, comprendre leur architecture basée sur le cycle Thought-Action-Observation, et découvrir comment ils peuvent être utilisés dans des cas d'usage concrets.

C'est quoi un agent ReAct ?

Un agent ReAct est une architecture d'agent IA qui combine raisonnement (Reasoning) et action (Acting) de manière synergique. Introduit par des chercheurs de Google et Princeton en 2022, ce paradigme permet aux modèles de langage de résoudre des problèmes en alternant entre des phases de réflexion et des phases d'exécution d'actions concrètes.

Schéma agent ReAct

L'idée fondamentale derrière ReAct est de rendre explicite le processus de raisonnement du modèle. Au lieu de produire directement une réponse, l'agent verbalise ses pensées, planifie ses actions, les exécute, puis observe les résultats avant de continuer son raisonnement. Cette approche présente plusieurs caractéristiques essentielles.

  • Traçabilité du raisonnement : chaque étape de réflexion est explicitement formulée, ce qui permet de comprendre et de déboguer le comportement de l'agent.
  • Interaction avec l'environnement : l'agent peut utiliser des outils externes (recherche web, calculatrice, API) pour obtenir des informations qu'il ne possède pas intrinsèquement.
  • Adaptabilité : en fonction des observations obtenues, l'agent peut ajuster sa stratégie et corriger ses erreurs.

Cette architecture se distingue des approches purement basées sur le prompting en permettant une véritable boucle de rétroaction entre le raisonnement et l'action.

Le cycle Thought-Action-Observation

Le cœur du fonctionnement d'un agent ReAct repose sur un cycle itératif composé de trois phases distinctes : Thought (Pensée), Action et Observation. Ce cycle se répète jusqu'à ce que l'agent atteigne son objectif ou décide qu'il a suffisamment d'informations pour formuler une réponse finale.

La phase de pensée est le moment où l'agent verbalise son raisonnement. Il analyse la situation actuelle, évalue les informations dont il dispose et planifie sa prochaine action. Cette étape est cruciale car elle rend le processus de décision transparent et interprétable.


À découvrir : notre formation Agentic AI


Durant cette phase, l'agent peut par exemple se demander :

  • Quelles informations me manquent pour répondre à la question ?
  • Quel outil serait le plus approprié pour obtenir ces informations ?
  • Comment dois-je formuler ma requête pour obtenir des résultats pertinents ?

Une fois le raisonnement effectué, l'agent passe à l'exécution d'une action concrète. Cette action peut prendre différentes formes selon les outils mis à sa disposition :

  • Effectuer une recherche sur le web
  • Interroger une base de données
  • Exécuter un calcul mathématique
  • Appeler une API externe
  • Lire le contenu d'un fichier

L'action est généralement formulée de manière structurée, avec le nom de l'outil à utiliser et les paramètres nécessaires à son exécution.

Après l'exécution de l'action, l'agent reçoit une observation, c'est-à-dire le résultat de son action. Cette observation est ensuite intégrée dans le contexte de l'agent, enrichissant ainsi sa base de connaissances pour les itérations suivantes.

L'observation peut être :

  • Le résultat d'une recherche web (extraits de pages)
  • La réponse d'une API
  • Le résultat d'un calcul
  • Un message d'erreur si l'action a échoué
Cycle Thought-Action-Observation

Ce cycle se poursuit jusqu'à ce que l'agent estime avoir suffisamment d'informations pour produire une réponse finale à la question initiale.

Contexte et mémoire de l'agent

Pour fonctionner efficacement, un agent ReAct doit disposer d'un système de gestion du contexte et de la mémoire. Ces éléments sont essentiels pour maintenir la cohérence du raisonnement tout au long des différentes itérations.

Le contexte d'un agent ReAct comprend plusieurs éléments.

  • La requête initiale : la question ou la tâche soumise par l'utilisateur.
  • L'historique des interactions : l'ensemble des pensées, actions et observations précédentes.
  • Les instructions système : les directives qui définissent le comportement attendu de l'agent.
  • La description des outils : la liste des outils disponibles avec leurs fonctionnalités.

Ce contexte est généralement transmis au LLM sous forme de prompt structuré, qui s'enrichit à chaque itération du cycle.

La mémoire d'un agent peut être de deux types.

  • Mémoire à court terme : elle correspond au contexte de la conversation en cours. Elle permet à l'agent de se souvenir des étapes précédentes et d'éviter de répéter les mêmes actions.

  • Mémoire à long terme : certaines implémentations permettent de persister des informations entre différentes sessions, permettant à l'agent d'apprendre de ses expériences passées.


À lire : découvrez notre formation Agentic AI


La gestion efficace de la mémoire est un défi technique important, notamment en raison des limites de fenêtre contextuelle des LLM. Des stratégies comme la summarization ou la sélection des informations les plus pertinentes sont souvent employées pour optimiser l'utilisation du contexte disponible.

Les outils et l'environnement d'exécution

Un agent ReAct tire sa puissance de sa capacité à interagir avec des outils externes. Ces outils constituent l'environnement dans lequel l'agent peut agir et obtenir des informations.

Les outils mis à disposition d'un agent ReAct peuvent être variés.

Type d'outilDescriptionExemple d'utilisation
Recherche webPermet d'accéder à des informations actualiséesTrouver les dernières actualités sur un sujet
CalculatriceEffectue des opérations mathématiquesCalculer des statistiques financières
Base de donnéesInterroge des données structuréesRécupérer des informations clients
API externesAccède à des services tiersConsulter la météo, les cours de bourse
Système de fichiersLit et écrit des fichiersAnalyser le contenu d'un document

L'environnement d'exécution d'un agent ReAct doit être soigneusement configuré pour garantir à la fois sécurité et efficacité.

from langchain.agents import Tool

# Exemple de définition d'un outil pour un agent ReAct
search_tool = Tool(
    name="web_search",
    description="Utile pour rechercher des informations actualisées sur internet. L'entrée doit être une requête de recherche.",
    func=search_function
)

calculator_tool = Tool(
    name="calculator",
    description="Utile pour effectuer des calculs mathématiques. L'entrée doit être une expression mathématique valide.",
    func=calculator_function
)

La description des outils est particulièrement importante car c'est elle qui permet au LLM de décider quel outil utiliser dans une situation donnée. Une description claire et précise améliore significativement les performances de l'agent.

Avantages des agents ReAct

Les agents ReAct présentent de nombreux avantages qui expliquent leur popularité croissante.

  • Transparence du raisonnement : contrairement aux modèles « boîte noire », les agents ReAct verbalisent explicitement leur processus de réflexion. Cela facilite le débogage, l'audit et la compréhension des décisions prises par l'agent.

  • Capacité d'auto-correction : grâce au cycle itératif, l'agent peut détecter ses erreurs via les observations et ajuster son approche. Si une action ne produit pas le résultat escompté, l'agent peut reformuler sa stratégie.

  • Accès à des informations externes : les agents ReAct ne sont pas limités aux connaissances encapsulées dans le LLM. Ils peuvent accéder à des données actualisées, interroger des bases de données ou utiliser des services spécialisés.

  • Flexibilité et extensibilité : il est facile d'ajouter de nouveaux outils à un agent ReAct pour étendre ses capacités. Cette modularité permet d'adapter l'agent à des cas d'usage très variés.

  • Meilleure gestion des tâches complexes : pour des problèmes nécessitant plusieurs étapes de raisonnement et la combinaison d'informations de sources diverses, les agents ReAct surpassent généralement les approches classiques de prompting.

Inconvénients et limites

Malgré leurs atouts, les agents ReAct présentent également des limitations qu'il convient de prendre en compte.

  • Coût computationnel élevé : le cycle itératif implique de nombreux appels au LLM, ce qui augmente significativement les coûts d'utilisation et les temps de réponse. Pour des tâches simples, cette approche peut être surdimensionnée.

  • Risque de boucles infinies : si l'agent ne parvient pas à atteindre son objectif, il peut entrer dans des boucles où il répète les mêmes actions sans progresser. Des mécanismes de limite d'itérations sont généralement nécessaires.

  • Dépendance à la qualité des outils : les performances de l'agent sont directement liées à la fiabilité et à la pertinence des outils mis à sa disposition. Un outil mal configuré ou une API défaillante peuvent compromettre l'ensemble du processus.

  • Complexité de mise en œuvre : la configuration d'un agent ReAct robuste nécessite une attention particulière à de nombreux aspects : définition des outils, gestion des erreurs, optimisation du contexte, etc.

  • Hallucinations persistantes : bien que le cycle d'observation permette de corriger certaines erreurs, les agents ReAct restent susceptibles de produire des raisonnements erronés ou des informations inventées, notamment si les observations sont ambiguës.

Cas d'utilisation des agents ReAct

Les agents ReAct trouvent leur utilité dans de nombreux domaines où la combinaison de raisonnement et d'action est nécessaire.

Assistants de recherche

Un agent ReAct peut servir d'assistant de recherche intelligent capable de :

  • Rechercher des informations sur plusieurs sources
  • Croiser et vérifier les données obtenues
  • Synthétiser les résultats de manière cohérente

Par exemple, pour répondre à une question comme « Quelles sont les dernières avancées en matière de batteries pour véhicules électriques ? », l'agent peut effectuer plusieurs recherches, comparer les sources et produire une synthèse structurée.

Automatisation de tâches métier

Dans un contexte professionnel, les agents ReAct peuvent automatiser des workflows complexes :

  • Analyser des données provenant de différents systèmes
  • Générer des rapports en interrogeant plusieurs bases de données
  • Effectuer des vérifications croisées et signaler les anomalies

Support client avancé

Un agent ReAct peut améliorer significativement le support client en :

  • Accédant à l'historique des interactions client
  • Consultant la base de connaissances produit
  • Vérifiant l'état des commandes ou des tickets en temps réel

Analyse financière

Dans le domaine financier, les agents ReAct peuvent :

  • Collecter des données de marché en temps réel
  • Effectuer des calculs complexes
  • Croiser des informations provenant de multiples sources pour produire des analyses

À découvrir : notre formation Agentic AI


Exemple de fonctionnement

Pour illustrer concrètement le fonctionnement d'un agent ReAct, prenons l'exemple d'une question simple : « Quelle est la population de la France et comment a-t-elle évolué ces 10 dernières années ? »

Thought: Je dois trouver la population actuelle de la France et son évolution sur 10 ans. 
Je vais commencer par rechercher la population actuelle.

Action: web_search("population France 2024")

Observation: La population de la France est estimée à 68,4 millions d'habitants en 2024 
selon l'INSEE.

Thought: J'ai la population actuelle. Maintenant je dois trouver les données historiques 
pour calculer l'évolution sur 10 ans.

Action: web_search("population France 2014 INSEE")

Observation: En 2014, la population française était de 66,2 millions d'habitants.

Thought: Je peux maintenant calculer l'évolution.

Action: calculator("((68.4 - 66.2) / 66.2) * 100")

Observation: 3.32

Thought: J'ai toutes les informations nécessaires pour répondre à la question.

Final Answer: La population de la France est actuellement de 68,4 millions d'habitants 
(2024). Sur les 10 dernières années, elle a augmenté d'environ 2,2 millions d'habitants, 
soit une croissance de 3,3% par rapport à 2014 où elle était de 66,2 millions.

Cet exemple illustre parfaitement le cycle Thought-Action-Observation et la manière dont l'agent décompose un problème en étapes successives pour construire une réponse complète et vérifiable.

Conclusion

Les agents ReAct représentent une évolution significative dans le domaine de l'IA agentique. En combinant explicitement raisonnement et action, ils offrent une approche transparente et efficace pour résoudre des tâches complexes nécessitant l'accès à des informations externes.

Leur architecture basée sur le cycle Thought-Action-Observation permet non seulement d'obtenir des résultats plus fiables, mais aussi de comprendre et d'auditer le processus de décision de l'agent. Cette traçabilité est particulièrement précieuse dans des contextes professionnels où la justification des réponses est importante.

Cependant, comme toute technologie, les agents ReAct ne sont pas une solution universelle. Leur coût computationnel et leur complexité de mise en œuvre doivent être mis en balance avec les bénéfices attendus. Pour des tâches simples, des approches plus directes peuvent s'avérer plus adaptées.

L'avenir des agents ReAct s'annonce prometteur, avec des améliorations continues en termes d'efficacité, de robustesse et de capacités. L'intégration de mécanismes de mémoire plus sophistiqués et l'élargissement des écosystèmes d'outils disponibles devraient encore renforcer leur utilité dans les années à venir.

Articles similaires

Blog

3 déc. 2025

Agentic AI

Le Model Context Protocol (MCP) est un protocole de communication open source conçu pour standardiser la façon dont les applications basées sur des LLM accèdent à des données contextuelles et interagissent avec des outils externes. Lancé par Anthropic fin 2024, il répond à un besoin croissant d'interopérabilité dans l'écosystème de l'IA générative.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

1 déc. 2025

Agentic AI

Langfuse est une plateforme d'observabilité et de monitoring spécialement conçue pour les applications utilisant des LLM. Développée en open source, elle permet aux équipes de développement de suivre, analyser et améliorer leurs systèmes d'IA générative tout au long de leur cycle de vie.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

28 nov. 2025

Agentic AI

L'essor de l'Agentic AI a donné naissance à différentes architectures d'agents, chacune adaptée à des contextes spécifiques. Parmi elles, l'agent Plan-and-Execute se distingue par son approche méthodique : plutôt que de raisonner pas à pas de manière réactive, il commence par élaborer un plan complet avant de l'exécuter étape par étape.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article