Embedding
Auch bekannt als: Einbettung, Texteinbettung, Vektor-Embedding
Ein Embedding ist die mathematische Darstellung eines Textstücks als Zahlenvektor. Semantisch ähnliche Texte haben ähnliche Vektoren. Das ist die Grundlage für semantische Suche und RAG.
Stell dir vor, jeder Satz bekommt eine Position in einem mehrdimensionalen Raum. Sätze mit ähnlicher Bedeutung landen nah beieinander, auch wenn sie andere Wörter verwenden. Das ist ein Embedding.
Wofür Embeddings genutzt werden
Semantische Suche: "Wie kündige ich?" findet auch Dokumente über "Arbeitsvertrag beenden", weil die Embeddings nah beieinander liegen.
RAG: Dokumente werden als Embeddings gespeichert. Bei einer Frage wird das Embedding der Frage berechnet und die ähnlichsten Dokumente abgerufen.
Clustering: Ähnliche Kundenanfragen gruppieren, ohne manuelle Kategorien zu definieren.