Orchestration / Agent Guardrail
FR EN

Orchestration

Agent Guardrail

Le garde-fou de l’agent : il contraint en temps réel les actions et les appels d’outils décidés par l’orchestrateur.

Plan
Orchestration
Étapes du flux
6
Référentiels
OWASP LLM06 · NIST 800-53 · MITRE ATLAS

Technologie

Pourquoi l’utiliser

Imposer des règles d’action à l’agent au moment de l’exécution, indépendamment de ce que le modèle « décide ».

Pourquoi c’est important pour la sécurité

Dernière barrière avant qu’une action d’agent ne touche un outil ou une donnée : il applique le moindre privilège action par action.

Implémentations NVIDIA NeMo GuardrailsGuardrails AIInvariantrègles PEP maison

Ne faites pas confiance au modèle pour s’auto-limiter : contraignez-le de l’extérieur.

Recommandations par palier de maturité

Survolez une recommandation pour l’explication · chaque recommandation porte son numéro de contrôle

Foundation

Socle minimal viable
  • Validation des appels d’outils contre une politique.
    NIST 800-53 AC-3
    Chaque appel d’outil est vérifié avant exécution.
  • Paramètres d’outils validés et assainis.
    NIST 800-53 SI-10
    Un argument d’outil non validé est une injection en puissance.
  • Journalisation de chaque action.
    NIST 800-53 AU-2 · AU-12
    Toute action d’agent doit être imputable.

Enterprise

Standard d’entreprise
  • Application du moindre privilège action par action.
    NIST 800-53 AC-6OWASP LLM06:2025
    Les droits sont accordés à l’action, pas à l’agent en bloc.
  • Confirmation requise pour les actions à fort impact.
    NIST 800-53 AC-3
    Suppression, paiement, envoi externe : on exige une garantie supplémentaire.
  • Plafonds de fréquence et de portée.
    NIST 800-53 SC-5
    Borner la fréquence limite l’ampleur d’un abus.

Advanced

Haute exigence / régulé
  • Décision d’action déléguée au PDP en contexte.
    NIST 800-53 AC-24
    L’autorisation d’agir dépend du risque courant, pas d’un droit figé.
  • Détection et blocage des séquences dangereuses.
    NIST 800-53 SI-4 · AC-4
    Des actions inoffensives séparément sont bloquées une fois combinées.
  • Quarantaine de l’agent sur anomalie.
    NIST 800-53 AC-12
    Un agent suspect est suspendu automatiquement.

Notes d’architecture

  • Rendez l’action dangereuse impossible, pas seulement pénible.détails ▸
    Une confirmation se contourne ; une capacité absente, non.
    Préférez retirer l’outil dangereux à l’agent plutôt que d’ajouter une friction.

Références

OWASP LLM06:2025
Excessive Agency — le guardrail applique la limite à l’exécution.
NIST SP 800-53 Rev5
AC-3, AC-6, AC-24, SI-10, AC-4, SC-5.
MITRE ATLAS — AML.T0051
Injection de prompt menant à des actions d’agent non voulues.

Abréviations

PDP
Policy Decision Point · point de décision d’autorisation
PEP
Policy Enforcement Point · point d’application des politiques
PIP
Policy Information Point · point d’information de politique
PAP
Policy Administration Point · point d’administration des politiques
IdP
Identity Provider · fournisseur d’identité
TSS
Token Service · service de jetons
NHI
Non-Human Identity · identité non-humaine
RBAC
Role-Based Access Control · contrôle d’accès basé sur les rôles
ABAC
Attribute-Based Access Control · contrôle d’accès basé sur les attributs
MFA
Multi-Factor Authentication · authentification multifacteur
HITL
Human-in-the-loop · validation humaine dans la boucle
JIT
Just-In-Time · juste-à-temps
CAE
Continuous Access Evaluation · évaluation continue de l’accès
CAEP
Continuous Access Evaluation Profile
DPoP
Demonstrating Proof-of-Possession · preuve de possession du jeton
mTLS
mutual TLS · TLS mutuel
PII
Personally Identifiable Information · données à caractère personnel
KMS
Key Management Service · service de gestion des clés
CI/CD
Continuous Integration / Continuous Delivery
SIEM
Security Information and Event Management
SOAR
Security Orchestration, Automation and Response
SCIM
System for Cross-domain Identity Management
XACML
eXtensible Access Control Markup Language
OPA
Open Policy Agent
OWASP
Open Worldwide Application Security Project
NIST
National Institute of Standards and Technology
ATLAS
Adversarial Threat Landscape for Artificial-Intelligence Systems
LLM
Large Language Model · grand modèle de langage
WAF
Web Application Firewall · pare-feu applicatif web
CDN
Content Delivery Network · réseau de diffusion de contenu
DDoS
Distributed Denial of Service · déni de service distribué
DLP
Data Loss Prevention · prévention des fuites de données
JWT
JSON Web Token
API
Application Programming Interface · interface de programmation
CRS
Core Rule Set (OWASP) · jeu de règles de base
RAG
Retrieval-Augmented Generation · génération augmentée par récupération
MCP
Model Context Protocol · protocole de contexte pour les modèles
PBAC
Permission-Based Access Control · contrôle d’accès par permissions
HSM
Hardware Security Module · module matériel de sécurité
UEBA
User and Entity Behavior Analytics · analyse comportementale
SBOM
Software Bill of Materials · nomenclature logicielle
SLSA
Supply-chain Levels for Software Artifacts
WORM
Write Once, Read Many · écriture unique
SPIFFE
Secure Production Identity Framework For Everyone