Gender Data Gap

Der Gender Data Gap bezeichnet die systematische Lücke in Datensätzen, die entsteht, wenn Daten überwiegend von und über Männer erhoben werden. In der KI führt dieser Gap dazu, dass Modelle und Anwendungen die Lebensrealität von Frauen schlechter abbilden, falsch interpretieren oder komplett ignorieren.

Was der Gender Data Gap ist

Der Begriff stammt aus Caroline Criado-Perez’ Buch „Invisible Women“ (2019). Die zentrale These: Die meisten Datensätze, auf denen unsere Systeme basieren, wurden mit Männern als Norm erhoben. Männliche Körper, männliche Arbeitsweisen, männliche Mobilitätsmuster. Frauen kommen als eigene Datenkategorie oft nicht vor.

Dieser Gap betrifft nicht nur KI, sondern die gesamte Datenlandschaft: Medizin, Stadtplanung, Produktdesign, Crashtest-Dummies, Sprachassistenten, Klimaforschung. KI verschärft das Problem, weil sie diese Datensätze nutzt und die Verzerrungen in ihre Ergebnisse übernimmt.

Wie der Gender Data Gap in KI wirkt

Medizinische KI: Herzinfarkt-Symptome bei Frauen weichen von denen bei Männern ab. KI-Systeme, die mit überwiegend männlichen Daten trainiert wurden, erkennen weibliche Symptome schlechter.

Spracherkennung: Sprachmodelle wurden überwiegend mit männlichen Stimmen trainiert. Weibliche Stimmen, höhere Stimmlagen und bestimmte Sprachmuster werden weniger zuverlässig erkannt.

Bewerbungstools: KI-gestützte Recruiting-Systeme, die auf historischen Einstellungsdaten trainiert wurden, bevorzugen männliche Bewerber, weil Männer in der Vergangenheit häufiger eingestellt wurden.

Bildgenerierung: Promptet man "CEO" in einem Bildgenerator, erhält man überwiegend Bilder von weißen Männern. Das Modell reproduziert die Verteilung in seinen Trainingsdaten.

Was sich ändern muss

Der Gender Data Gap lässt sich nicht allein mit besserer Technologie schließen. Es braucht bewusste Entscheidungen bei der Datenerhebung (welche Daten fehlen?), bei der Modellentwicklung (wer testet das System, und mit wessen Perspektive?) und bei der Regulierung (der EU AI Act fordert Bias-Prüfungen für Hochrisiko-KI-Systeme).

Der erste Schritt ist, die Lücke sichtbar zu machen. Solange der Gender Data Gap nicht benannt wird, fällt er nicht auf.


🔗 Verwandte Begriffe: 

Bias (KI), Künstliche Intelligenz (KI), Trainingsdaten, EU AI Act, Deep Learning


➡ Du willst KI in deinem Arbeitsalltag einsetzen? In meinen „KI at Work“ Kursen zeige ich dir Schritt für Schritt, wie das geht. Ohne Vorwissen.



Änderungshistorie:

  • Erstveröffentlichung Juni 2026.