Concevoir un Système Multi-Agents Personnalisé avec Mémoire à Long Terme

La construction de systèmes d’Intelligence Artificielle complexes s’oriente de plus en plus vers des architectures multi-agents. Contrairement à un simple modèle conversationnel, un système multi-agents orchestre plusieurs spécialistes d’IA, chacun avec un rôle précis, pour accomplir une tâche globale.

Dans cet article, fortement inspiré des avancées de Google Cloud avec le projet Dev Signal, nous allons plonger dans l’architecture d’un système personnalisé intégrant le Model Context Protocol (MCP) et une mémoire à long terme via Vertex AI.

Que vous soyez débutant curieux ou développeur senior, préparez-vous à explorer les coulisses de l’orchestration IA !

1. La Vision Globale : Pourquoi une Architecture Multi-Agents ?

Un agent IA unique peut vite être dépassé par une tâche complexe nécessitant de la recherche, de la synthèse technique et de la création de contenu. En divisant le travail entre plusieurs agents spécialistes, supervisés par un orchestrateur, le système gagne en précision, en modularité et en efficacité.

graph TD
    User([Utilisateur]) --> Orchestrator
    Orchestrator((Agent Orchestrateur))

    subgraph Équipe d'Agents Spécialistes
        Orchestrator -->|Délègue la veille| Agent1[Agent Explorateur<br/>Ex: Reddit Scanner]
        Orchestrator -->|Délègue la validation| Agent2[Expert Technique<br/>Ex: Expert GCP]
        Orchestrator -->|Délègue la rédaction| Agent3[Créateur de Contenu<br/>Ex: Rédacteur de Blog]
    end

    Agent1 -.->|Tendances| Orchestrator
    Agent2 -.->|Faits vérifiés| Orchestrator
    Agent3 -.->|Article final| Orchestrator
    Orchestrator --> User

Dans ce modèle, l’Orchestrateur est le chef de projet. Il analyse la demande de l’utilisateur, vérifie la mémoire pour récupérer le contexte historique, puis coordonne les agents spécialisés.

2. Le Cœur du Système : Les Types de Mémoire

L’un des défis majeurs des IA est l’oubli. Pour qu’un système devienne véritablement un assistant personnalisé, il doit posséder deux types de mémoires distinctes.

Mémoire à Court Terme (Session)

La mémoire à court terme (ou mémoire de travail) permet aux agents de collaborer au sein d’une même session. Lorsqu’un agent Expert termine son analyse, il la place dans un état partagé (ToolContext.state) pour que l’agent Rédacteur puisse s’en servir immédiatement.

sequenceDiagram
    participant O as Orchestrateur
    participant A1 as Expert Technique
    participant State as État Partagé (Court Terme)
    participant A2 as Rédacteur

    O->>A1: Requête: "Analyse ce problème"
    A1->>A1: Recherche & Synthèse
    A1->>State: Sauvegarde (add_info_to_state)
    O->>A2: Requête: "Rédige l'article"
    A2->>State: Récupère l'analyse
    A2-->>O: Article rédigé

Mémoire à Long Terme (Vertex AI)

C’est ici que la magie opère. La mémoire à long terme persiste les préférences de l’utilisateur (style d’écriture préféré, sujets d’intérêt) à travers de multiples sessions.

En utilisant les services comme la Vertex AI Memory Bank, le système convertit les interactions textuelles en vecteurs mathématiques (embeddings) stockés dans une base de données. À chaque nouvelle conversation, le système rappelle proactivement ce contexte.

flowchart LR
    A[Interaction Utilisateur] --> B{Callback Automatique}
    B -->|Ingestion| C(Vertex AI Embedding)
    C -->|Stockage Vectoriel| D[(Vertex AI Memory Bank)]

    E[Nouvelle Session] --> F(PreloadMemoryTool)
    D -->|Recherche Sémantique| F
    F --> G[Contexte de l'Orchestrateur]

3. L’intégration des Outils : Model Context Protocol (MCP)

Pour que les agents interagissent avec le monde réel (Reddit, bases documentaires, générateurs d’images), l’architecture utilise le Model Context Protocol (MCP). Ce protocole standardise la manière dont les modèles d’IA se connectent à des sources de données ou à des outils externes.

Voici comment les agents spécialisés utilisent leurs outils :

L’Agent Explorateur : Utilise un serveur MCP connecté aux réseaux sociaux pour dénicher des sujets tendances (détection de signaux).
L’Expert Technique : Croise les données sociales avec la documentation officielle (via un MCP Developer Knowledge) et des recherches web.
Le Rédacteur : Utilise le fruit des recherches, applique les préférences de style (récupérées en mémoire à long terme), et peut solliciter un outil de génération multimédia pour illustrer l’article.

graph LR
    subgraph Agents
        A1(Explorateur)
        A2(Expert)
        A3(Rédacteur)
    end

    subgraph Outils MCP
        M1[Serveur MCP Réseaux Sociaux]
        M2[Serveur MCP Documentation GCP]
        M3[Serveur MCP Génération d'Images]
    end

    A1 <--> M1
    A2 <--> M2
    A3 <--> M3

Conclusion

La création d’un système multi-agents dépasse la simple écriture de prompts. C’est un travail d’architecture logicielle :

L’Orchestration divise la complexité.
Le Protocole MCP offre des bras et des yeux à l’IA.
La Mémoire (Court et Long Terme) dote l’IA d’une conscience contextuelle et d’une continuité.

En adoptant cette approche, nous ne créons plus de simples “chatbots”, mais de véritables équipes numériques capables d’apprendre et de s’adapter continuellement à nos besoins de développement !

Source d’inspiration et de référence technique officielle : Architect A Personalized Multi-Agent System with Long-Term Memory, Blog Google Cloud.