RAG Retrieval Augmented Generation
Große Sprachmodelle wirken oft wie allwissende Wissensdatenbanken, weil sie flüssig formulieren, komplexe Themen erklären und Fragen in Sekunden beantworten können.
Tatsächlich erzeugen sie jedoch in erster Linie wahrscheinlich klingende Texte und können dadurch sehr überzeugend wirken, auch wenn Inhalte faktisch falsch sind – was vor allem in beruflichen Kontexten mit Regeln, Verträgen oder Spezifikationen kritisch werden kann. Retrieval Augmented Generation (RAG) setzt genau hier an, indem es Sprachmodelle mit gezielt abgerufenen, verlässlichen Dokumenten verbindet. Mehr...
In der Rubrik Frequently Asked Questions finden sich kompakte Antworten auf die häufigsten Fragen rund um Retrieval‑Augmented Generation: von den Grundlagen über typische Anwendungsfälle bis hin zu technischen Bausteinen. Mehr...
RAG Allgemein
I. Einleitung: Warum „RAG“ mehr ist als ein Schlagwort
II. Grundlagen: Was Retrieval Augmented Generation leistet – und was nicht
III. Retrieval und Suche: Dense, Sparse, BM25, Hybrid Search und die Rolle von Vektordatenbanken
IV. Pipeline Bausteine: Chunking, Embedding Modell, Top K, Query Rewriting, Router, Grader und Reflection Tokens
Mehr...
RAG Architekturen
Standard RAG
·
Conversational RAG
·
Corrective RAG (CRAG)
·
Adaptive RAG
·
Self-RAG
·
Fusion RAG
·
Hypothetical Document Embeddings (HyDE)
·
Agentic RAG
·
GraphRAG
Mehr...
Eigenes RAG System bauen
Kombiniere die Sprachstärke eines LLM mit deinem Fachwissen: interne Dokus, PDFs, usw. So bekommst du aktualisierbare, nachvollziehbare und unternehmensspezifische Antworten. Was du dafür brauchst: Mehr...
RAG Software
In diesem Abschnitt befindet sich eine strukturierte Übersicht über alle benötigten Bausteine und direkten RAG Download Links, ihre Aufgaben im System und passende Software – inklusive der wichtigsten Vorteile und möglichen Risiken. Mehr...
Komplette RAG‑Lösung
Hier steht eine vollständig vorbereitete Retrieval‑Augmented‑Generation‑Pipeline zur Verfügung, die direkt heruntergeladen, lokal ausgeführt und flexibel auf eigene Daten zugeschnitten werden kann. Mehr...