Wissen · RAG-Glossar

RAG, einfach erklärt

Die wichtigsten Begriffe rund um Retrieval Augmented Generation, kurz und ohne Fachchinesisch. Für alle, die mitreden wollen, ohne Informatik studiert zu haben.

RAG (Retrieval Augmented Generation): Eine Methode, bei der eine KI vor dem Antworten in Ihren eigenen Dokumenten nachschlägt. So beruht die Antwort auf Ihrem Wissen, nicht nur auf dem Training des Modells, und lässt sich mit Quelle belegen.
Embedding: Eine Zahlendarstellung von Text, die Bedeutung greifbar macht. Ähnliche Inhalte liegen im Zahlenraum nah beieinander, so findet das System Passendes auch dann, wenn andere Wörter benutzt wurden.
Chunking: Das Zerlegen von Dokumenten in kleinere Abschnitte, bevor sie durchsuchbar gemacht werden. Wie groß und wie geschnitten wird, entscheidet stark über die Antwortqualität. Mehr dazu im Artikel.
Vektordatenbank: Ein Speicher für Embeddings, der blitzschnell die ähnlichsten Abschnitte zu einer Frage findet. Beispiele sind pgvector, Qdrant und Vespa.ai.
Retrieval: Der Schritt, in dem das System zu einer Frage die passenden Textstellen aus Ihren Dokumenten heraussucht. Die Qualität dieses Schritts entscheidet, ob die Antwort stimmt.
Reranking: Ein zweiter Sortierschritt, der die gefundenen Stellen nach echter Relevanz neu ordnet, bevor die KI antwortet. Das hebt die Treffer nach oben, die wirklich passen.
Hybrid Search: Die Kombination aus klassischer Stichwortsuche und semantischer Vektorsuche. Zusammen finden sie mehr als jede für sich: exakte Begriffe und sinnverwandte Treffer.
Eval / Ragas: Das systematische Messen der Antwortqualität gegen ein Test-Set, statt sie zu schätzen. Ragas ist ein verbreitetes Werkzeug dafür.
Halluzination: Wenn eine KI etwas Plausibles, aber Falsches behauptet. Gutes RAG senkt das Risiko, weil die Antwort an belegte Quellen gebunden ist.
Context Window (Kontextfenster): Die Menge an Text, die ein Sprachmodell auf einmal verarbeiten kann. Sie begrenzt, wie viele gefundene Stellen gleichzeitig in eine Antwort einfließen.