Retrieval Augmented Generation (RAG) ist eine Methode, bei der ein Sprachmodell vor der Antwortgenerierung zunächst relevante Informationen aus einer externen Datenquelle abruft. Dadurch antwortet die KI auf Basis konkreter Fakten statt auf Basis statistischer Muster.
Ein normales Sprachmodell generiert Antworten ausschließlich aus seinem Training. Es weiß nur, was in den Trainingsdaten stand. RAG fügt einen Zwischenschritt ein: Bevor das Modell antwortet, durchsucht es eine externe Datenquelle (z.B. eine Wissensdatenbank, ein Dokumentenarchiv, eine Webseite) und zieht die relevanten Informationen in die Antwort ein.
Das Ergebnis: Die KI antwortet auf Basis konkreter, aktueller Fakten statt auf Basis vager Muster. Die Halluzinationsrate sinkt erheblich, weil das Modell nicht raten muss.
Für Unternehmen ist RAG die derzeit wichtigste Methode, um KI auf eigene Daten anzuwenden. Ein Chatbot für den Kundenservice, der Zugriff auf die aktuelle Produktdokumentation hat. Ein interner Assistent, der Fragen zu Unternehmensrichtlinien anhand der tatsächlichen Dokumente beantwortet. Ein Recherchetool, das Antworten aus einer geprüften Fachdatenbank zieht.
Ohne RAG würde das Modell in all diesen Fällen allgemeine Antworten geben oder Informationen erfinden. Mit RAG greift es auf die echten Quellen zu.
RAG und Fine-Tuning lösen unterschiedliche Probleme. Fine-Tuning verändert das Modell selbst (es lernt neues Verhalten). RAG verändert die Wissensbasis, auf die das Modell zugreift. RAG ist schneller umzusetzen, günstiger und die Daten lassen sich jederzeit aktualisieren, ohne das Modell neu zu trainieren.
🔗 Verwandte Begriffe:
Halluzination, Large Language Model (LLM), KI-Agent, Fine-Tuning, Chatbot
➡ Du willst KI in deinem Arbeitsalltag einsetzen? In meinen „KI at Work“ Kursen zeige ich dir Schritt für Schritt, wie das geht. Ohne Vorwissen.
Änderungshistorie: