Wissen · RAG-Glossar

RAG, einfach erklärt

Die wichtigsten Begriffe rund um Retrieval Augmented Generation, kurz und ohne Fachchinesisch. Für alle, die mitreden wollen, ohne Informatik studiert zu haben.

RAG (Retrieval Augmented Generation)
Eine Methode, bei der eine KI vor dem Antworten in Ihren eigenen Dokumenten nachschlägt. So beruht die Antwort auf Ihrem Wissen, nicht nur auf dem Training des Modells, und lässt sich mit Quelle belegen.
Embedding
Eine Zahlendarstellung von Text, die Bedeutung greifbar macht. Ähnliche Inhalte liegen im Zahlenraum nah beieinander, so findet das System Passendes auch dann, wenn andere Wörter benutzt wurden.
Chunking
Das Zerlegen von Dokumenten in kleinere Abschnitte, bevor sie durchsuchbar gemacht werden. Wie groß und wie geschnitten wird, entscheidet stark über die Antwortqualität. Mehr dazu im Artikel.
Vektordatenbank
Ein Speicher für Embeddings, der blitzschnell die ähnlichsten Abschnitte zu einer Frage findet. Beispiele sind pgvector, Qdrant und Vespa.ai.
Retrieval
Der Schritt, in dem das System zu einer Frage die passenden Textstellen aus Ihren Dokumenten heraussucht. Die Qualität dieses Schritts entscheidet, ob die Antwort stimmt.
Reranking
Ein zweiter Sortierschritt, der die gefundenen Stellen nach echter Relevanz neu ordnet, bevor die KI antwortet. Das hebt die Treffer nach oben, die wirklich passen.
Eval / Ragas
Das systematische Messen der Antwortqualität gegen ein Test-Set, statt sie zu schätzen. Ragas ist ein verbreitetes Werkzeug dafür.
Halluzination
Wenn eine KI etwas Plausibles, aber Falsches behauptet. Gutes RAG senkt das Risiko, weil die Antwort an belegte Quellen gebunden ist.
Context Window (Kontextfenster)
Die Menge an Text, die ein Sprachmodell auf einmal verarbeiten kann. Sie begrenzt, wie viele gefundene Stellen gleichzeitig in eine Antwort einfließen.