KI-Datennutzungsrichtlinie

1. Zweck

Diese Richtlinie definiert, wie [Name der Organisation] Daten im Zusammenhang mit KI-Systemen erhebt, verarbeitet, speichert und weitergibt. Sie bestätigt, dass die gesamte KI-bezogene Datennutzung den geltenden Datenschutzgesetzen entspricht, die Rechte des Einzelnen respektiert und das Vertrauen von Kunden, Mitarbeitenden und Partnern wahrt.

2. Geltungsbereich

Diese Richtlinie gilt für:

Alle Daten, die zum Trainieren, Feinabstimmen, Validieren, Testen oder Betreiben von KI-Systemen verwendet werden.
Alle von KI-Systemen erzeugten Daten (Vorhersagen, Empfehlungen, Inhalte, Entscheidungen).
Alle Daten, die an Drittanbieter-KI-Dienste übermittelt oder von diesen empfangen werden.
Alle Mitarbeitenden, Auftragnehmer und Partner, die im Zusammenhang mit KI mit Daten umgehen.

3. Definitionen

Personenbezogene Daten: Alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen, wie in DSGVO Artikel 4 Absatz 1 definiert.
Besondere Kategorien personenbezogener Daten: Daten, die die rassische oder ethnische Herkunft, politische Meinungen, religiöse Überzeugungen, Gewerkschaftszugehörigkeit, genetische Daten, biometrische Daten, Gesundheitsdaten oder Daten zum Sexualleben oder zur sexuellen Orientierung offenbaren (DSGVO Artikel 9).
Trainingsdaten: Daten, die zum Erstellen, Trainieren oder Feinabstimmen eines KI-Modells verwendet werden.
Inferenzdaten: Daten, die von einem KI-System zur Laufzeit verarbeitet werden, um Ergebnisse zu erzeugen.
Synthetische Daten: Künstlich erzeugte Daten, die reale Datenmuster nachbilden, ohne tatsächliche personenbezogene Informationen zu enthalten.
Rechtsgrundlage: Die rechtliche Grundlage, auf der personenbezogene Daten verarbeitet werden (Einwilligung, Vertrag, rechtliche Verpflichtung, lebenswichtige Interessen, öffentliche Aufgabe oder berechtigte Interessen).

4. Rechtsgrundlage für KI-Datenverarbeitung

Bevor personenbezogene Daten in einem KI-System verwendet werden, muss die Rechtsgrundlage identifiziert und dokumentiert werden. Nicht jede KI-Nutzung erfordert eine Einwilligung — die DSGVO erlaubt mehrere Rechtsgrundlagen. Jede muss jedoch im Einzelfall geprüft werden.

Rechtsgrundlage	Anwendbarkeit bei KI	Wesentliche Anforderungen
Einwilligung (Art. 6 Abs. 1 lit. a)	Betroffene stimmen der KI-Verarbeitung ausdrücklich zu	Muss freiwillig, spezifisch, informiert und unmissverständlich sein. Kann widerrufen werden.
Vertrag (Art. 6 Abs. 1 lit. b)	KI-Verarbeitung ist zur Erfüllung eines Vertrags erforderlich	Muss tatsächlich erforderlich sein, nicht nur zweckmäßig.
Berechtigte Interessen (Art. 6 Abs. 1 lit. f)	KI-Verarbeitung dient einem berechtigten Geschäftsinteresse, das die Rechte des Einzelnen nicht überwiegt	Erfordert eine dokumentierte Interessenabwägung.
Rechtliche Verpflichtung (Art. 6 Abs. 1 lit. c)	KI-Verarbeitung ist gesetzlich vorgeschrieben (z. B. Pflicht zur Betrugserkennung)	Die spezifische rechtliche Verpflichtung muss benannt werden.

Besondere Kategorien personenbezogener Daten erfordern eine zusätzliche Bedingung gemäß DSGVO Artikel 9 Absatz 2 und dürfen niemals ohne ausdrückliche rechtliche Prüfung für KI-Training verwendet werden.

5. Datenerhebung und -beschaffung

Daten müssen für festgelegte, eindeutige und legitime Zwecke erhoben werden (Zweckbindung).
Es dürfen nur Daten erhoben werden, die dem Zweck angemessen und erheblich sowie auf das notwendige Maß beschränkt sind (Datenminimierung).
Die Quelle und Herkunft aller in der KI verwendeten Daten muss dokumentiert werden.
Gekaufte oder lizenzierte Daten müssen klare Bedingungen haben, die ihre Verwendung im KI-Training und bei der Inferenz erlauben.
Aus dem Internet erhobene Daten (Web Scraping) müssen vor der Verwendung auf Urheberrecht, Nutzungsbedingungen und personenbezogene Dateninhalte überprüft werden.
Synthetische Daten sind zu bevorzugen, wenn reale Daten nicht erforderlich sind oder wenn Datenschutzrisiken hoch sind.

6. Datenqualität und -genauigkeit

EU AI Act Artikel 10 verlangt, dass Trainingsdaten für Hochrisiko-Systeme "relevant, repräsentativ, fehlerfrei und vollständig" sind. Alle KI-Daten müssen die folgenden Standards erfüllen:

Daten müssen vor der Verwendung auf Richtigkeit, Vollständigkeit und Aktualität überprüft werden.
Bekannte Datenqualitätsprobleme müssen dokumentiert und ihre Auswirkungen auf die Modellleistung bewertet werden.
Bias-Screening muss bei Trainings- und Evaluierungsdatensätzen durchgeführt werden.
Datenqualitätskennzahlen müssen erfasst und dem Modellverantwortlichen gemeldet werden.

7. Datenspeicherung und -löschung

Daten dürfen nicht länger aufbewahrt werden, als es für den angegebenen Zweck erforderlich ist (Speicherbegrenzung).
Aufbewahrungsfristen müssen für jeden Datensatz und jedes KI-System festgelegt und dokumentiert werden.
Bei Stilllegung eines Modells müssen die zugehörigen Trainings- und Inferenzdaten auf Löschung oder Anonymisierung überprüft werden.
Einzelpersonen haben das Recht, die Löschung ihrer Daten zu verlangen. Bei Eingang eines Löschantrags muss die Auswirkung auf aktive KI-Systeme bewertet und der Antrag erfüllt werden, soweit gesetzlich erforderlich.
Audit-Protokolle und Compliance-Nachweise können gemäß gesetzlichen und regulatorischen Anforderungen länger aufbewahrt werden.

8. Datenweitergabe und Übermittlung an Dritte

An Drittanbieter-KI-Dienstleister weitergegebene Daten müssen durch eine Auftragsverarbeitungsvereinbarung (AVV) geregelt sein, die Zweck, Sicherheitsmaßnahmen, Unterauftragsverarbeiter und Betroffenenrechte festlegt.
Grenzüberschreitende Übermittlungen müssen DSGVO Kapitel V entsprechen (Angemessenheitsbeschlüsse, Standardvertragsklauseln oder verbindliche Unternehmensregeln).
Anforderungen an den Datenstandort müssen für jedes KI-System dokumentiert werden.
Drittanbieter-KI-Dienstleister dürfen Kundendaten nicht für ihr eigenes Modelltraining verwenden, es sei denn, dies wird ausdrücklich genehmigt.

9. Automatisierte Entscheidungsfindung

Wenn KI-Systeme Entscheidungen über Einzelpersonen treffen oder wesentlich beeinflussen:

Einzelpersonen müssen darüber informiert werden, dass eine automatisierte Verarbeitung stattfindet (DSGVO Artikel 13/14).
Einzelpersonen haben das Recht, nicht einer ausschließlich auf automatisierter Verarbeitung beruhenden Entscheidung unterworfen zu werden, die rechtliche Wirkung entfaltet oder sie in ähnlicher Weise erheblich beeinträchtigt (DSGVO Artikel 22).
Für Entscheidungen mit hoher Tragweite muss eine sinnvolle menschliche Überprüfung verfügbar sein.
Die involvierte Logik, die Bedeutung und die voraussichtlichen Konsequenzen müssen der betroffenen Person erklärt werden.

10. Datenschutz-Folgenabschätzungen

Eine Datenschutz-Folgenabschätzung (DSFA) muss vor der Bereitstellung von KI-Systemen durchgeführt werden, die:

Personenbezogene Daten in großem Umfang verarbeiten.
Eine systematische Überwachung von Personen beinhalten.
Besondere Kategorien personenbezogener Daten verarbeiten.
Automatisierte Entscheidungsfindung mit rechtlichen oder erheblichen Auswirkungen nutzen.
Datensätze aus mehreren Quellen in einer Weise kombinieren, die Einzelpersonen vernünftigerweise nicht erwarten können.

11. Rollen und Verantwortlichkeiten

Rolle	Verantwortlichkeiten in der Datennutzung
Datenverantwortlicher	Verantwortlich für Datenqualität, Klassifizierung, Zugangsgenehmigungen und Compliance ihrer Datensätze.
Modellverantwortlicher	Stellt sicher, dass die KI-System-Datennutzung dokumentiert, die Rechtsgrundlage identifiziert und Aufbewahrungsfristen definiert sind.
Datenschutzbeauftragter	Prüft DSFAs, berät zur Rechtsgrundlage, bearbeitet Betroffenenanfragen, koordiniert mit Aufsichtsbehörden.
Recht	Prüft Datenlizenzierung, Anbieter-AVVs, grenzüberschreitende Übermittlungsmechanismen.
Alle Mitarbeitenden	Gehen mit Daten gemäß der Klassifizierung um, melden Datenqualitätsprobleme, absolvieren Datenschutzschulungen.

12. Regulatorische Ausrichtung

DSGVO: Artikel 5 (Grundsätze), 6 (Rechtsgrundlage), 9 (besondere Kategorien), 13-14 (Transparenz), 17 (Recht auf Löschung), 22 (automatisierte Entscheidungen), 25 (Datenschutz durch Technikgestaltung), 35 (DSFAs).
EU AI Act: Artikel 10 (Daten-Governance für Hochrisiko-Systeme), Artikel 13 (Transparenz).
ISO/IEC 42001: Anhang B (B.7 — Daten für KI-Systeme).
NIST AI RMF: MAP-Funktion (MP-3, KI-Risiken durch Drittanbieterdaten).

13. Überprüfung

Diese Richtlinie wird jährlich oder früher überprüft, wenn dies durch regulatorische Änderungen, Datenschutzverletzungen oder wesentliche Änderungen der KI-Datenverarbeitungsaktivitäten ausgelöst wird.

Dokumentenlenkung

Feld	Wert
Richtlinienverantwortlicher	[Datenschutzbeauftragter]
Genehmigt durch	[KI-Governance-Ausschuss]
Inkrafttreten	[Datum]
Nächste Überprüfung	[Datum + 12 Monate]
Version	1.0
Klassifizierung	Intern