Data-Governance im Lichte der KI-Verordnung

Potenziale und Risiken von KI

In der aktuellen Diskussion stehen die Risiken und Gefahren von Künstlicher Intelligenz (KI) oft im Vordergrund. Auf der anderen Seite stehen die Vorteile, die der Einsatz von KI für nahezu alle Bereiche der Gesellschaft mit sich bringt. Die EU-Kommission sieht ein enormes Potenzial in KI-Systemen, um Herausforderungen wie Ressourcenallokation, Gesundheitsversorgung und Bildung zu bewältigen. Finanzexperten prognostizieren, dass generative KI das globale BIP in den nächsten zehn Jahren um 7% steigern könnte.

Der europäische Gesetzgeber adressiert aus diesem Grund sowohl Potenziale als auch Risiken des KI-Einsatzes und präsentierte im April 2021 seinen Entwurf für die KI-Verordnung (KI-VO-E). Ziel ist es, einen einheitlichen Rechtsrahmen für vertrauenswürdige und ethische KI in der gesamten Union zu schaffen. Die Verordnung zielt weiter darauf ab, die Werte und Grundrechte der EU vor dem Hintergrund der immer größer werdenden Bedeutung von KI nachhaltig und umfassend zu gewährleisten und Investitionen zu fördern.

Kurzüberblick über die KI-VO-E

Die KI-VO-E legt umfassende Regeln für die Entwicklung und den Einsatz von KI-Systemen in der EU fest und stellt spezifische Anforderungen an die Beschaffenheit und Auswahl der Trainingsdaten. Sie richtet sich an alle Akteure in der KI-Wertschöpfungskette, also alle, die in der EU an der Entwicklung oder Nutzung von KI-Systemen beteiligt sind, einschließlich Anbietern aus Drittstaaten. Die Verordnung verfolgt einen risikobasierten Ansatz, in dem sie verschiedene Risikokategorien für KI-Systeme definiert und Anforderungen entsprechend ihres Risikos festlegt. Hochrisiko-KI-Systeme unterliegen gem. Art. 10 KI-VO-E auch hinsichtlich ihrer Data-Governance strengeren Anforderungen. Die Kategorisierung der KI-Systeme und die Bestimmung ihres Risikos erfolgen gemäß den Anhängen II und III der Verordnung.

Artikel 10 KI-VO-E formuliert Anforderungen an Trainings-, Validierungs- und Testdatensätze, die in der Entwicklung und Bewertung von KI-Systemen verwendet werden. Die Qualität und Auswahl dieser Daten sind entscheidend für die Leistungsfähigkeit, Fairness und Zuverlässigkeit von KI-Systemen. Nach dem Verordnungsentwurf müssen Trainingsdaten relevant, repräsentativ und ausgewogen sein. Sie dürfen keine diskriminierenden Merkmale enthalten und müssen dem Verwendungszweck des KI-Systems entsprechen. Die Qualität der Daten ist während des gesamten Lebenszyklus des KI-Systems zu überwachen und sicherzustellen. Anbieter von KI-Systemen müssen die Herkunft, Qualität und Eigenschaften der Trainingsdaten dokumentieren und transparent machen. Dies dient der Nachvollziehbarkeit und Überprüfbarkeit der KI-Systeme. Die geplante Verordnung legt auch Anforderungen an die Dokumentation von Datenverarbeitungsprozessen und -entscheidungen fest. Damit Marktteilnehmer über die notwendigen Ressourcen verfügen, um vertrauenswürdige und ethische KI-Systeme zu entwickeln, regelt der Verordnungsentwurf den Zugang zu relevanten und repräsentativen Daten für die Entwicklung, Validierung und Bewertung von KI-Systemen. Der Zugang zu Daten kann durch öffentliche Datenbanken, über Partnerschaften oder die Anschlussnutzung bereits vorhandener interner Datensätze erfolgen.

Ausblick

Die KI-Verordnung stellt zentrale Anforderungen an Daten und Data-Governance, um die Vertrauenswürdigkeit sowie ethische Entwicklung und Anwendung von KI-Systemen sicherzustellen. Sie zielt darauf ab, diskriminierende Praktiken zu verhindern und die Transparenz von KI-Systemen zu erhöhen. Unternehmen müssen die Betrachtung eigener Datenbestände, die zur Verwendung in der KI-Entwicklung vorgesehen sind, sowie die eigenen Entwicklungsprozesse kritisch analysieren und auf die neuen Compliance-Anforderungen abstimmen. Die KI Governance hat dabei große Schnittmengen zur Datenschutz-Compliance und kann daher bestenfalls nahtlos in bestehende Prozesse integriert werden. Dies gilt insbesondere hinsichtlich der für die Data Governance relevanten Prozesse der Datenbeschaffung und -anforderung, der Organisation der Data Hubs und der angeschlossenen Dokumentationsprozesse.