Orchestration
Agent Guardrail
Le garde-fou de l’agent : il contraint en temps réel les actions et les appels d’outils décidés par l’orchestrateur.
Plan
Orchestration
Étapes du flux
6
Référentiels
OWASP LLM06 · NIST 800-53 · MITRE ATLAS
Technologie
Pourquoi l’utiliser
Imposer des règles d’action à l’agent au moment de l’exécution, indépendamment de ce que le modèle « décide ».
Pourquoi c’est important pour la sécurité
Dernière barrière avant qu’une action d’agent ne touche un outil ou une donnée : il applique le moindre privilège action par action.
Implémentations NVIDIA NeMo GuardrailsGuardrails AIInvariantrègles PEP maison
Ne faites pas confiance au modèle pour s’auto-limiter : contraignez-le de l’extérieur.
Recommandations par palier de maturité
Foundation
Socle minimal viable
- Validation des appels d’outils contre une politique. NIST 800-53 AC-3Chaque appel d’outil est vérifié avant exécution.
- Paramètres d’outils validés et assainis. NIST 800-53 SI-10Un argument d’outil non validé est une injection en puissance.
- Journalisation de chaque action. NIST 800-53 AU-2 · AU-12Toute action d’agent doit être imputable.
Enterprise
Standard d’entreprise
- Application du moindre privilège action par action. NIST 800-53 AC-6OWASP LLM06:2025Les droits sont accordés à l’action, pas à l’agent en bloc.
- Confirmation requise pour les actions à fort impact. NIST 800-53 AC-3Suppression, paiement, envoi externe : on exige une garantie supplémentaire.
- Plafonds de fréquence et de portée. NIST 800-53 SC-5Borner la fréquence limite l’ampleur d’un abus.
Advanced
Haute exigence / régulé
- Décision d’action déléguée au PDP en contexte. NIST 800-53 AC-24L’autorisation d’agir dépend du risque courant, pas d’un droit figé.
- Détection et blocage des séquences dangereuses. NIST 800-53 SI-4 · AC-4Des actions inoffensives séparément sont bloquées une fois combinées.
- Quarantaine de l’agent sur anomalie. NIST 800-53 AC-12Un agent suspect est suspendu automatiquement.
Notes d’architecture
- Rendez l’action dangereuse impossible, pas seulement pénible.détails ▸Une confirmation se contourne ; une capacité absente, non.Préférez retirer l’outil dangereux à l’agent plutôt que d’ajouter une friction.
Références
OWASP LLM06:2025
Excessive Agency — le guardrail applique la limite à l’exécution.
NIST SP 800-53 Rev5
AC-3, AC-6, AC-24, SI-10, AC-4, SC-5.
MITRE ATLAS — AML.T0051
Injection de prompt menant à des actions d’agent non voulues.
Abréviations
PDP
Policy Decision Point · point de décision d’autorisation
PEP
Policy Enforcement Point · point d’application des politiques
PIP
Policy Information Point · point d’information de politique
PAP
Policy Administration Point · point d’administration des politiques
IdP
Identity Provider · fournisseur d’identité
TSS
Token Service · service de jetons
NHI
Non-Human Identity · identité non-humaine
RBAC
Role-Based Access Control · contrôle d’accès basé sur les rôles
ABAC
Attribute-Based Access Control · contrôle d’accès basé sur les attributs
MFA
Multi-Factor Authentication · authentification multifacteur
HITL
Human-in-the-loop · validation humaine dans la boucle
JIT
Just-In-Time · juste-à-temps
CAE
Continuous Access Evaluation · évaluation continue de l’accès
CAEP
Continuous Access Evaluation Profile
DPoP
Demonstrating Proof-of-Possession · preuve de possession du jeton
mTLS
mutual TLS · TLS mutuel
PII
Personally Identifiable Information · données à caractère personnel
KMS
Key Management Service · service de gestion des clés
CI/CD
Continuous Integration / Continuous Delivery
SIEM
Security Information and Event Management
SOAR
Security Orchestration, Automation and Response
SCIM
System for Cross-domain Identity Management
XACML
eXtensible Access Control Markup Language
OPA
Open Policy Agent
OWASP
Open Worldwide Application Security Project
NIST
National Institute of Standards and Technology
ATLAS
Adversarial Threat Landscape for Artificial-Intelligence Systems
LLM
Large Language Model · grand modèle de langage
WAF
Web Application Firewall · pare-feu applicatif web
CDN
Content Delivery Network · réseau de diffusion de contenu
DDoS
Distributed Denial of Service · déni de service distribué
DLP
Data Loss Prevention · prévention des fuites de données
JWT
JSON Web Token
API
Application Programming Interface · interface de programmation
CRS
Core Rule Set (OWASP) · jeu de règles de base
RAG
Retrieval-Augmented Generation · génération augmentée par récupération
MCP
Model Context Protocol · protocole de contexte pour les modèles
PBAC
Permission-Based Access Control · contrôle d’accès par permissions
HSM
Hardware Security Module · module matériel de sécurité
UEBA
User and Entity Behavior Analytics · analyse comportementale
SBOM
Software Bill of Materials · nomenclature logicielle
SLSA
Supply-chain Levels for Software Artifacts
WORM
Write Once, Read Many · écriture unique
SPIFFE
Secure Production Identity Framework For Everyone