Gateway & Protection

Input Guardrail

Sécurité du prompt et détection d’intention : valider et assainir l’entrée avant l’orchestration et le modèle.

Plan

Gateway & Protection

Étapes du flux

Référentiels

OWASP LLM01 · NIST 800-53 · MITRE ATLAS · NIST AI 600-1

Technologie

Pourquoi l’utiliser

Valider, assainir et qualifier l’entrée (prompt, intention) avant qu’elle n’atteigne l’orchestrateur ou le modèle.

Pourquoi c’est important pour la sécurité

Contre-mesure directe à l’injection de prompt (directe et indirecte) et au jailbreak — la menace n°1 des applications LLM.

Implémentations Lakera GuardNVIDIA NeMo GuardrailsLlama GuardRebuffPrompt Security

Données et instructions ne doivent jamais se confondre dans le contexte du modèle.

Recommandations par palier de maturité

Survolez une recommandation pour l’explication · chaque recommandation porte son numéro de contrôle

Foundation

Socle minimal viable

Validation de schéma / longueur et listes de blocage.
NIST 800-53 SI-10OWASP LLM01:2025

Le premier filtre arrête les attaques connues et les entrées hors format.
Isolation et délimitation du contenu non fiable (spotlighting).
OWASP LLM01:2025

Marquer clairement les données empêche le modèle de les exécuter comme des ordres.
Journalisation des entrées rejetées.
NIST 800-53 AU-2

Les tentatives bloquées révèlent les campagnes d’attaque en cours.

Enterprise

Standard d’entreprise

Classifieurs d’injection et de jailbreak.
OWASP LLM01:2025MITRE ATLAS AML.T0051

Un classifieur sémantique attrape les variantes que les signatures manquent.
Détection d’intention et de contenu sensible.
NIST 800-53 SI-10

Comprendre ce que veut faire la requête permet de la router ou de la bloquer.
Séparation stricte données / instructions.
NIST 800-53 AC-4

Le flux d’information est contrôlé pour qu’une donnée ne devienne jamais une commande.

Advanced

Haute exigence / régulé

Détection adaptative et red-teaming continu.
NIST 800-53 SI-4NIST AI 600-1 MS-2.7-007

On éprouve en continu le guardrail contre de nouvelles attaques d’injection.
Quarantaine et télémétrie.
NIST 800-53 SI-4 · AU-6

L’entrée suspecte est isolée et tracée pour analyse.
Réévaluation des classifieurs sur nouveaux contournements.
NIST 800-53 CM-3

Le modèle de détection se met à jour au rythme des contournements.

Notes d’architecture

L’injection indirecte est la plus dangereuse.détails ▸

Elle vient des données récupérées (RAG, web, e-mail), pas de l’utilisateur.

Aucune confiance par défaut au contenu récupéré : il doit passer le même guardrail que l’entrée utilisateur.

Références

OWASP LLM01:2025

Prompt Injection — la menace traitée en priorité par ce composant.

NIST SP 800-53 Rev5

SI-10 (Input Validation), AC-4 (Information Flow), SI-4 (Monitoring).

MITRE ATLAS — AML.T0051

Injection de prompt (Initial Access / exécution d’instructions cachées).

NIST AI 600-1

MS-2.7-007 — red-teaming des attaques d’injection.

Abréviations

PDP

Policy Decision Point · point de décision d’autorisation

PEP

Policy Enforcement Point · point d’application des politiques

PIP

Policy Information Point · point d’information de politique

PAP

Policy Administration Point · point d’administration des politiques

IdP

Identity Provider · fournisseur d’identité

TSS

Token Service · service de jetons

NHI

Non-Human Identity · identité non-humaine

RBAC

Role-Based Access Control · contrôle d’accès basé sur les rôles

ABAC

Attribute-Based Access Control · contrôle d’accès basé sur les attributs

MFA

Multi-Factor Authentication · authentification multifacteur

HITL

Human-in-the-loop · validation humaine dans la boucle

JIT

Just-In-Time · juste-à-temps

CAE

Continuous Access Evaluation · évaluation continue de l’accès

CAEP

Continuous Access Evaluation Profile

DPoP

Demonstrating Proof-of-Possession · preuve de possession du jeton

mTLS

mutual TLS · TLS mutuel

PII

Personally Identifiable Information · données à caractère personnel

KMS

Key Management Service · service de gestion des clés

CI/CD

Continuous Integration / Continuous Delivery

SIEM

Security Information and Event Management

SOAR

Security Orchestration, Automation and Response

SCIM

System for Cross-domain Identity Management

XACML

eXtensible Access Control Markup Language

OPA

Open Policy Agent

OWASP

Open Worldwide Application Security Project

NIST

National Institute of Standards and Technology

ATLAS

Adversarial Threat Landscape for Artificial-Intelligence Systems

LLM

Large Language Model · grand modèle de langage

WAF

Web Application Firewall · pare-feu applicatif web

CDN

Content Delivery Network · réseau de diffusion de contenu

DDoS

Distributed Denial of Service · déni de service distribué

DLP

Data Loss Prevention · prévention des fuites de données

JWT

JSON Web Token

API

Application Programming Interface · interface de programmation

CRS

Core Rule Set (OWASP) · jeu de règles de base

RAG

Retrieval-Augmented Generation · génération augmentée par récupération

MCP

Model Context Protocol · protocole de contexte pour les modèles

PBAC

Permission-Based Access Control · contrôle d’accès par permissions

HSM

Hardware Security Module · module matériel de sécurité

UEBA

User and Entity Behavior Analytics · analyse comportementale

SBOM

Software Bill of Materials · nomenclature logicielle

SLSA

Supply-chain Levels for Software Artifacts

WORM

Write Once, Read Many · écriture unique

SPIFFE

Secure Production Identity Framework For Everyone