Gateway & Protection / Input Guardrail
FR EN

Gateway & Protection

Input Guardrail

Sécurité du prompt et détection d’intention : valider et assainir l’entrée avant l’orchestration et le modèle.

Plan
Gateway & Protection
Étapes du flux
5
Référentiels
OWASP LLM01 · NIST 800-53 · MITRE ATLAS · NIST AI 600-1

Technologie

Pourquoi l’utiliser

Valider, assainir et qualifier l’entrée (prompt, intention) avant qu’elle n’atteigne l’orchestrateur ou le modèle.

Pourquoi c’est important pour la sécurité

Contre-mesure directe à l’injection de prompt (directe et indirecte) et au jailbreak — la menace n°1 des applications LLM.

Implémentations Lakera GuardNVIDIA NeMo GuardrailsLlama GuardRebuffPrompt Security

Données et instructions ne doivent jamais se confondre dans le contexte du modèle.

Recommandations par palier de maturité

Survolez une recommandation pour l’explication · chaque recommandation porte son numéro de contrôle

Foundation

Socle minimal viable
  • Validation de schéma / longueur et listes de blocage.
    NIST 800-53 SI-10OWASP LLM01:2025
    Le premier filtre arrête les attaques connues et les entrées hors format.
  • Isolation et délimitation du contenu non fiable (spotlighting).
    OWASP LLM01:2025
    Marquer clairement les données empêche le modèle de les exécuter comme des ordres.
  • Journalisation des entrées rejetées.
    NIST 800-53 AU-2
    Les tentatives bloquées révèlent les campagnes d’attaque en cours.

Enterprise

Standard d’entreprise
  • Classifieurs d’injection et de jailbreak.
    OWASP LLM01:2025MITRE ATLAS AML.T0051
    Un classifieur sémantique attrape les variantes que les signatures manquent.
  • Détection d’intention et de contenu sensible.
    NIST 800-53 SI-10
    Comprendre ce que veut faire la requête permet de la router ou de la bloquer.
  • Séparation stricte données / instructions.
    NIST 800-53 AC-4
    Le flux d’information est contrôlé pour qu’une donnée ne devienne jamais une commande.

Advanced

Haute exigence / régulé
  • Détection adaptative et red-teaming continu.
    NIST 800-53 SI-4NIST AI 600-1 MS-2.7-007
    On éprouve en continu le guardrail contre de nouvelles attaques d’injection.
  • Quarantaine et télémétrie.
    NIST 800-53 SI-4 · AU-6
    L’entrée suspecte est isolée et tracée pour analyse.
  • Réévaluation des classifieurs sur nouveaux contournements.
    NIST 800-53 CM-3
    Le modèle de détection se met à jour au rythme des contournements.

Notes d’architecture

  • L’injection indirecte est la plus dangereuse.détails ▸
    Elle vient des données récupérées (RAG, web, e-mail), pas de l’utilisateur.
    Aucune confiance par défaut au contenu récupéré : il doit passer le même guardrail que l’entrée utilisateur.

Références

OWASP LLM01:2025
Prompt Injection — la menace traitée en priorité par ce composant.
NIST SP 800-53 Rev5
SI-10 (Input Validation), AC-4 (Information Flow), SI-4 (Monitoring).
MITRE ATLAS — AML.T0051
Injection de prompt (Initial Access / exécution d’instructions cachées).
NIST AI 600-1
MS-2.7-007 — red-teaming des attaques d’injection.

Abréviations

PDP
Policy Decision Point · point de décision d’autorisation
PEP
Policy Enforcement Point · point d’application des politiques
PIP
Policy Information Point · point d’information de politique
PAP
Policy Administration Point · point d’administration des politiques
IdP
Identity Provider · fournisseur d’identité
TSS
Token Service · service de jetons
NHI
Non-Human Identity · identité non-humaine
RBAC
Role-Based Access Control · contrôle d’accès basé sur les rôles
ABAC
Attribute-Based Access Control · contrôle d’accès basé sur les attributs
MFA
Multi-Factor Authentication · authentification multifacteur
HITL
Human-in-the-loop · validation humaine dans la boucle
JIT
Just-In-Time · juste-à-temps
CAE
Continuous Access Evaluation · évaluation continue de l’accès
CAEP
Continuous Access Evaluation Profile
DPoP
Demonstrating Proof-of-Possession · preuve de possession du jeton
mTLS
mutual TLS · TLS mutuel
PII
Personally Identifiable Information · données à caractère personnel
KMS
Key Management Service · service de gestion des clés
CI/CD
Continuous Integration / Continuous Delivery
SIEM
Security Information and Event Management
SOAR
Security Orchestration, Automation and Response
SCIM
System for Cross-domain Identity Management
XACML
eXtensible Access Control Markup Language
OPA
Open Policy Agent
OWASP
Open Worldwide Application Security Project
NIST
National Institute of Standards and Technology
ATLAS
Adversarial Threat Landscape for Artificial-Intelligence Systems
LLM
Large Language Model · grand modèle de langage
WAF
Web Application Firewall · pare-feu applicatif web
CDN
Content Delivery Network · réseau de diffusion de contenu
DDoS
Distributed Denial of Service · déni de service distribué
DLP
Data Loss Prevention · prévention des fuites de données
JWT
JSON Web Token
API
Application Programming Interface · interface de programmation
CRS
Core Rule Set (OWASP) · jeu de règles de base
RAG
Retrieval-Augmented Generation · génération augmentée par récupération
MCP
Model Context Protocol · protocole de contexte pour les modèles
PBAC
Permission-Based Access Control · contrôle d’accès par permissions
HSM
Hardware Security Module · module matériel de sécurité
UEBA
User and Entity Behavior Analytics · analyse comportementale
SBOM
Software Bill of Materials · nomenclature logicielle
SLSA
Supply-chain Levels for Software Artifacts
WORM
Write Once, Read Many · écriture unique
SPIFFE
Secure Production Identity Framework For Everyone