Voice Cloning

Voice Cloning bezeichnet die KI-gestützte Erstellung einer digitalen Kopie einer menschlichen Stimme. Aus einer kurzen Audioaufnahme (ab wenigen Sekunden) lernt die KI Stimmfärbung, Betonung, Sprechrhythmus und Aussprache und kann damit beliebige neue Texte in dieser Stimme generieren.

Wie Voice Cloning funktioniert

Die KI analysiert eine Audioaufnahme und extrahiert die charakteristischen Merkmale der Stimme. Bei ElevenLabs reichen für einen ersten Klon wenige Sekunden Audio. Für höhere Qualität (Professional Voice Cloning) werden längere, hochwertigere Aufnahmen verwendet. Der resultierende Stimmklon kann beliebige Texte sprechen, in über 70 Sprachen.

Anwendungsbereiche

Content-Produktion: Podcasts, Hörbücher, Videovertonungen in der eigenen Stimme produzieren, ohne jedes Mal ins Studio zu müssen.

Barrierefreiheit: Menschen, die ihre Stimme verloren haben, können mit einem vorher erstellten Klon weiterhin in ihrer eigenen Stimme kommunizieren.

Mehrsprachigkeit: Die eigene Stimme in Sprachen sprechen lassen, die man selbst nicht beherrscht (AI Dubbing).

Risiken

Voice Cloning ermöglicht auch Missbrauch: Betrüger:innen können Stimmen klonen, um sich am Telefon als CEO, Vorgesetzte oder Familienangehörige auszugeben (CEO Fraud, Enkeltrick 2.0). Der EU AI Act verlangt ab August 2026, dass KI-generierte Audioinhalte als solche gekennzeichnet werden.

🔗 Verwandte Begriffe:

ElevenLabs, Sprachsynthese, AI Dubbing, Deepfake, Text-to-Speech

➡ Du willst KI in deinem Arbeitsalltag einsetzen? In meinen „KI at Work“ Kursen zeige ich dir Schritt für Schritt, wie das geht. Ohne Vorwissen.

Änderungshistorie:

Erstveröffentlichung Juni 2026.

KI Glossar KI Kurs Datenschutz Impressum