Orchestration

Agent Guardrail

Le garde-fou de l’agent : il contraint en temps réel les actions et les appels d’outils décidés par l’orchestrateur.

Plan

Orchestration

Étapes du flux

Référentiels

OWASP LLM06 · NIST 800-53 · MITRE ATLAS

Technologie

Pourquoi l’utiliser

Imposer des règles d’action à l’agent au moment de l’exécution, indépendamment de ce que le modèle « décide ».

Pourquoi c’est important pour la sécurité

Dernière barrière avant qu’une action d’agent ne touche un outil ou une donnée : il applique le moindre privilège action par action.

Implémentations NVIDIA NeMo GuardrailsGuardrails AIInvariantrègles PEP maison

Ne faites pas confiance au modèle pour s’auto-limiter : contraignez-le de l’extérieur.

Recommandations par palier de maturité

Survolez une recommandation pour l’explication · chaque recommandation porte son numéro de contrôle

Foundation

Socle minimal viable

Validation des appels d’outils contre une politique.
NIST 800-53 AC-3

Chaque appel d’outil est vérifié avant exécution.
Paramètres d’outils validés et assainis.
NIST 800-53 SI-10

Un argument d’outil non validé est une injection en puissance.
Journalisation de chaque action.
NIST 800-53 AU-2 · AU-12

Toute action d’agent doit être imputable.

Enterprise

Standard d’entreprise

Application du moindre privilège action par action.
NIST 800-53 AC-6OWASP LLM06:2025

Les droits sont accordés à l’action, pas à l’agent en bloc.
Confirmation requise pour les actions à fort impact.
NIST 800-53 AC-3

Suppression, paiement, envoi externe : on exige une garantie supplémentaire.
Plafonds de fréquence et de portée.
NIST 800-53 SC-5

Borner la fréquence limite l’ampleur d’un abus.

Advanced

Haute exigence / régulé

Décision d’action déléguée au PDP en contexte.
NIST 800-53 AC-24

L’autorisation d’agir dépend du risque courant, pas d’un droit figé.
Détection et blocage des séquences dangereuses.
NIST 800-53 SI-4 · AC-4

Des actions inoffensives séparément sont bloquées une fois combinées.
Quarantaine de l’agent sur anomalie.
NIST 800-53 AC-12

Un agent suspect est suspendu automatiquement.

Notes d’architecture

Rendez l’action dangereuse impossible, pas seulement pénible.détails ▸

Une confirmation se contourne ; une capacité absente, non.

Préférez retirer l’outil dangereux à l’agent plutôt que d’ajouter une friction.

Références

OWASP LLM06:2025

Excessive Agency — le guardrail applique la limite à l’exécution.

NIST SP 800-53 Rev5

AC-3, AC-6, AC-24, SI-10, AC-4, SC-5.

MITRE ATLAS — AML.T0051

Injection de prompt menant à des actions d’agent non voulues.

Abréviations

PDP

Policy Decision Point · point de décision d’autorisation

PEP

Policy Enforcement Point · point d’application des politiques

PIP

Policy Information Point · point d’information de politique

PAP

Policy Administration Point · point d’administration des politiques

IdP

Identity Provider · fournisseur d’identité

TSS

Token Service · service de jetons

NHI

Non-Human Identity · identité non-humaine

RBAC

Role-Based Access Control · contrôle d’accès basé sur les rôles

ABAC

Attribute-Based Access Control · contrôle d’accès basé sur les attributs

MFA

Multi-Factor Authentication · authentification multifacteur

HITL

Human-in-the-loop · validation humaine dans la boucle

JIT

Just-In-Time · juste-à-temps

CAE

Continuous Access Evaluation · évaluation continue de l’accès

CAEP

Continuous Access Evaluation Profile

DPoP

Demonstrating Proof-of-Possession · preuve de possession du jeton

mTLS

mutual TLS · TLS mutuel

PII

Personally Identifiable Information · données à caractère personnel

KMS

Key Management Service · service de gestion des clés

CI/CD

Continuous Integration / Continuous Delivery

SIEM

Security Information and Event Management

SOAR

Security Orchestration, Automation and Response

SCIM

System for Cross-domain Identity Management

XACML

eXtensible Access Control Markup Language

OPA

Open Policy Agent

OWASP

Open Worldwide Application Security Project

NIST

National Institute of Standards and Technology

ATLAS

Adversarial Threat Landscape for Artificial-Intelligence Systems

LLM

Large Language Model · grand modèle de langage

WAF

Web Application Firewall · pare-feu applicatif web

CDN

Content Delivery Network · réseau de diffusion de contenu

DDoS

Distributed Denial of Service · déni de service distribué

DLP

Data Loss Prevention · prévention des fuites de données

JWT

JSON Web Token

API

Application Programming Interface · interface de programmation

CRS

Core Rule Set (OWASP) · jeu de règles de base

RAG

Retrieval-Augmented Generation · génération augmentée par récupération

MCP

Model Context Protocol · protocole de contexte pour les modèles

PBAC

Permission-Based Access Control · contrôle d’accès par permissions

HSM

Hardware Security Module · module matériel de sécurité

UEBA

User and Entity Behavior Analytics · analyse comportementale

SBOM

Software Bill of Materials · nomenclature logicielle

SLSA

Supply-chain Levels for Software Artifacts

WORM

Write Once, Read Many · écriture unique

SPIFFE

Secure Production Identity Framework For Everyone