Ein Token ist die kleinste Einheit, in die ein Sprachmodell Text zerlegt. Ein Token kann ein Wort, ein Wortteil oder ein einzelnes Zeichen sein. Die Anzahl der Token bestimmt, wie viel Text ein Modell verarbeiten kann (Kontextfenster) und wie hoch die Nutzungskosten sind.
Sprachmodelle lesen keinen Text, wie Menschen das tun. Sie zerlegen Text in kleine Einheiten, sogenannte Token. Das Wort „Unternehmen“ könnte als ein Token verarbeitet werden, das Wort „Unternehmensberatung“ als zwei Token („Unternehmens“ + „beratung“). Ein Satzzeichen kann ein eigener Token sein.
Als Faustregel gilt: 1 Token entspricht etwa 0,75 Wörtern im Englischen. Im Deutschen, wo Wörter länger und zusammengesetzter sind, liegt das Verhältnis etwas niedriger. 1.000 Token entsprechen grob 600–700 deutschen Wörtern.
Kontextfenster: Jedes Sprachmodell hat eine maximale Anzahl an Token, die es gleichzeitig verarbeiten kann. Bei Claude sind das bis zu 1 Million Token, bei ChatGPT in der App ca. 400.000 Token. Alles, was über das Kontextfenster hinausgeht, vergisst das Modell. (Stand: Juni 2026)
Kosten: Über die API werden KI-Dienste pro Token abgerechnet. Je mehr Token eine Anfrage und eine Antwort umfassen, desto teurer wird es. Deshalb ist effizientes Prompting auch eine Kostenfrage.
Ausgabelimit: Neben dem Kontextfenster gibt es ein separates Limit für die Antwortlänge. Ein Modell kann ein großes Kontextfenster haben, aber trotzdem nur eine begrenzte Antwort generieren.
„1 Token = 1 Wort.“ Nein. Kurze, häufige Wörter sind oft 1 Token. Längere, seltenere Wörter werden in mehrere Token zerlegt. Leerzeichen und Satzzeichen zählen ebenfalls.
„Mehr Token = bessere Antwort.“ Nein. Die Qualität einer Antwort hängt vom Prompt und vom Modell ab, nicht von der Anzahl der Token.
🔗 Verwandte Begriffe:
Large Language Model (LLM), Kontextfenster, Prompt, ChatGPT, Claude
➡ Du willst KI in deinem Arbeitsalltag einsetzen? In meinen „KI at Work“ Kursen zeige ich dir Schritt für Schritt, wie das geht. Ohne Vorwissen.
Änderungshistorie: