Taxonomie de l'apprentissage automatique adversarial du NIST

Résumé

La publication du NIST sur l'apprentissage automatique adversarial fournit une taxonomie complète des attaques contre les systèmes d'apprentissage automatique et leurs atténuations correspondantes. Ce document est devenu une référence fondamentale pour les praticiens de la sécurité travaillant avec des systèmes d'IA.

Catégories d'attaques

Attaques par évasion : Manipulation des entrées pour causer des erreurs de classification pendant l'inférence
Attaques par empoisonnement : Corruption des données d'entraînement pour compromettre le comportement du modèle
Attaques de confidentialité : Extraction d'informations sensibles des modèles entraînés
Attaques par extraction de modèle : Vol de la propriété intellectuelle du modèle

Stratégies d'atténuation

Le document décrit les approches défensives pour chaque catégorie d'attaque :

Entraînement adversarial
Nettoyage des entrées
Confidentialité différentielle
Mécanismes de défense de modèle

À qui s'adresse cette ressource

Chercheurs en sécurité ML étudiant les menaces adversariales
Scientifiques des données construisant des modèles robustes
Équipes de sécurité protégeant les déploiements ML
Professionnels des politiques comprenant les risques de sécurité ML

Mots-clés

NISTML adversarialattaquessécurité

En bref

Publié

2024

Juridiction

États-Unis

Catégorie

Risk taxonomies

Accès

Accès public

Plus dans Risk taxonomies

Dépôt des risques IA du MIT

MIT FutureTech • 2024

OWASP Top 10 pour les applications LLM

OWASP • 2023

Base de données des incidents IA

Responsible AI Collaborative • 2021

Ressources connexes

Cadre de gestion des risques de l'intelligence artificielle (AI RMF 1.0)

Standards and certifications • NIST

Cadre de gestion des risques IA

Standards and certifications • NIST

Guide pratique du cadre de gestion des risques IA du NIST

Standards and certifications • NIST

Taxonomie de l'apprentissage automatique adversarial du NIST

Taxonomie de l'apprentissage automatique adversarial du NIST

Résumé

Catégories d'attaques

Stratégies d'atténuation

À qui s'adresse cette ressource

Mots-clés

En bref

Plus dans Risk taxonomies

Ressources connexes

Construisez votre programme de gouvernance de l'IA