Gateway & Protection / AI Gateway
FR EN

Gateway & Protection

AI Gateway

Point d’entrée unique vers les modèles : routage multi-fournisseurs, cache, quotas — et point d’application des politiques.

Plan
Gateway & Protection
Étapes du flux
1 · 5
Référentiels
NIST 800-53 · 800-207 · OWASP LLM10/01

Technologie

Pourquoi l’utiliser

Concentrer tout le trafic vers les modèles en un seul point : routage multi-fournisseurs, cache, normalisation et quotas.

Pourquoi c’est important pour la sécurité

C’est un PEP idéal : il centralise l’authentification, l’application des politiques, le plafonnement débit/coût et l’inspection entrée/sortie avant le modèle — un choke point auditable.

Implémentations Azure AI GatewayKong AI GatewayLiteLLMCloudflare AI GatewayApigee

Un seul chemin vers le modèle, donc un seul endroit où tout contrôler.

Recommandations par palier de maturité

Survolez une recommandation pour l’explication · chaque recommandation porte son numéro de contrôle

Foundation

Socle minimal viable
  • Routage centralisé et authentification des appels modèle.
    NIST 800-53 AC-3 · IA-5
    Aucun appel direct au modèle : tout passe par un point gouverné.
  • Journalisation de chaque appel modèle.
    NIST 800-53 AU-2 · AU-12
    Tracer prompts et réponses est indispensable à l’audit et au débogage de sécurité.
  • Plafond de débit et de jetons.
    NIST 800-53 SC-5OWASP LLM10:2025
    Borner les jetons protège à la fois la disponibilité et le budget.

Enterprise

Standard d’entreprise
  • Validation des requêtes (model guard).
    NIST 800-53 SI-10OWASP LLM01:2025
    Le gateway vérifie la forme et le contenu avant d’atteindre le modèle.
  • Quotas de coût / jetons par tenant et isolation.
    NIST 800-53 SC-5OWASP LLM10:2025
    Chaque tenant a son budget ; un abus reste confiné.
  • Cache sécurisé sans fuite inter-tenant.
    NIST 800-53 SC-4
    Un cache partagé mal isolé fait fuir les données d’un tenant vers un autre.

Advanced

Haute exigence / régulé
  • Décision PEP → PDP à chaque requête.
    NIST 800-53 AC-3 · AC-24NIST 800-207 §3.1
    L’accès au modèle devient une décision de politique contextuelle, pas un droit acquis.
  • Plafonnement adaptatif au risque.
    NIST 800-53 SI-4
    Les quotas se resserrent quand le comportement devient suspect.
  • Détection d’abus et de dérive de coût.
    NIST 800-53 SI-4
    Une boucle d’agent qui s’emballe est repérée avant la facture.

Notes d’architecture

  • Plafonnez le coût, pas seulement le débit.détails ▸
    Un agent en boucle peut épuiser un budget en minutes.
    LLM10 (Unbounded Consumption) couvre autant le coût que la disponibilité : imposez des quotas de jetons et de dépense.

Références

NIST SP 800-53 Rev5
AC-3, AC-24 (Access Control Decisions), SC-5 (DoS), SC-4 (Shared Resources), SI-10, AU-12.
NIST SP 800-207
§3.1 — l’AI Gateway comme Policy Enforcement Point devant le modèle.
OWASP LLM10:2025
Unbounded Consumption — quotas de jetons et de coût.

Abréviations

PDP
Policy Decision Point · point de décision d’autorisation
PEP
Policy Enforcement Point · point d’application des politiques
PIP
Policy Information Point · point d’information de politique
PAP
Policy Administration Point · point d’administration des politiques
IdP
Identity Provider · fournisseur d’identité
TSS
Token Service · service de jetons
NHI
Non-Human Identity · identité non-humaine
RBAC
Role-Based Access Control · contrôle d’accès basé sur les rôles
ABAC
Attribute-Based Access Control · contrôle d’accès basé sur les attributs
MFA
Multi-Factor Authentication · authentification multifacteur
HITL
Human-in-the-loop · validation humaine dans la boucle
JIT
Just-In-Time · juste-à-temps
CAE
Continuous Access Evaluation · évaluation continue de l’accès
CAEP
Continuous Access Evaluation Profile
DPoP
Demonstrating Proof-of-Possession · preuve de possession du jeton
mTLS
mutual TLS · TLS mutuel
PII
Personally Identifiable Information · données à caractère personnel
KMS
Key Management Service · service de gestion des clés
CI/CD
Continuous Integration / Continuous Delivery
SIEM
Security Information and Event Management
SOAR
Security Orchestration, Automation and Response
SCIM
System for Cross-domain Identity Management
XACML
eXtensible Access Control Markup Language
OPA
Open Policy Agent
OWASP
Open Worldwide Application Security Project
NIST
National Institute of Standards and Technology
ATLAS
Adversarial Threat Landscape for Artificial-Intelligence Systems
LLM
Large Language Model · grand modèle de langage
WAF
Web Application Firewall · pare-feu applicatif web
CDN
Content Delivery Network · réseau de diffusion de contenu
DDoS
Distributed Denial of Service · déni de service distribué
DLP
Data Loss Prevention · prévention des fuites de données
JWT
JSON Web Token
API
Application Programming Interface · interface de programmation
CRS
Core Rule Set (OWASP) · jeu de règles de base
RAG
Retrieval-Augmented Generation · génération augmentée par récupération
MCP
Model Context Protocol · protocole de contexte pour les modèles
PBAC
Permission-Based Access Control · contrôle d’accès par permissions
HSM
Hardware Security Module · module matériel de sécurité
UEBA
User and Entity Behavior Analytics · analyse comportementale
SBOM
Software Bill of Materials · nomenclature logicielle
SLSA
Supply-chain Levels for Software Artifacts
WORM
Write Once, Read Many · écriture unique
SPIFFE
Secure Production Identity Framework For Everyone