Embedding
Numerische Darstellung von Text als Vektor — ermöglicht Ähnlichkeitssuche und ist die Grundlage von RAG-Systemen.
Definition
Ein Embedding ist die Umwandlung von Text (Wörter, Sätze oder Dokumente) in einen hochdimensionalen numerischen Vektor. Ähnliche Texte bekommen ähnliche Vektoren, was mathematische Vergleiche ermöglicht. Embeddings sind die Grundlage für semantische Suche: Statt nach exakten Stichwörtern zu suchen, findet das System inhaltlich verwandte Ergebnisse. In RAG-Systemen werden Dokumente als Embeddings in einer Vektordatenbank gespeichert. Bei einer Anfrage wird die Frage ebenfalls in einen Vektor umgewandelt und die ähnlichsten Dokumente werden abgerufen. Wichtige Embedding-Modelle sind OpenAI text-embedding-3, Cohere Embed und Open-Source-Alternativen wie E5.
Verwandte Begriffe
KI-Wissen vertiefen?
KI-Überblick liefert täglich eingeordnete KI-Trends, Lernpfade und Deep Dives — 14 Tage kostenlos.
Kostenlos starten