Spring GDS 25. Jubiläum
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Retrieval-Augmented Generation ist ein Muster, das einem Sprachmodell relevantes Quellmaterial liefert, bevor es antwortet. Statt sich nur auf das zu stützen, was das Modell im Training gespeichert hat, ruft das System zuerst Passagen aus Ihrer eigenen Wissensbasis ab und bittet das Modell dann, mit diesem abgerufenen Kontext zu antworten.
Der Abrufschritt ist es, der es zum Funktionieren bringt. Die Frage eines Nutzers wird in eine Anfrage gegen einen Dokumentenspeicher umgewandelt, oft eine Vektordatenbank, die nach Bedeutung statt nach Schlüsselwörtern abgleicht. Die relevantesten Abschnitte kommen zurück, werden in den Prompt eingefügt, und das Modell erzeugt seine Antwort, geerdet in diesem Material. Ein Support-Assistent, der Ihre echten Richtliniendokumente mit Quellenangaben zitiert, statt aus allgemeinem Training zu raten, ist RAG in der Praxis.
Das löst zwei echte Probleme. Vor Monaten trainierte Modelle kennen Ihr neuestes Produkt oder die Preise der letzten Woche nicht, und sie halluzinieren, wenn man sie nach Dingen außerhalb ihres Trainings fragt. RAG hält die Antwort an aktuelle, eigene, überprüfbare Quellen gebunden, und das ist der Unterschied zwischen einer Demo und etwas, das Sie Kunden vorlegen können.
Wenn ein Kunde einen Chatbot will, der aus den eigenen Inhalten antwortet, ist RAG meist der ehrliche Weg dorthin. Wir indexieren die Wissensbasis, justieren, wie Dokumente zerlegt und abgerufen werden, und messen, ob der richtige Kontext wirklich auftaucht, bevor wir uns um die Formulierung des Modells sorgen. Schlechter Abruf lässt selbst ein großartiges Modell dumm wirken, also beginnt dort die Arbeit.
Unsere KI- und Machine-Learning-Lösungen verdrahten Abruf, Generierung und Quellenangaben in einer Schleife, mit Evaluation obendrauf, damit Genauigkeit etwas ist, das Sie verfolgen statt erhoffen. Wir haben Chatbots und virtuelle Assistenten gebaut, die in der echten Dokumentation eines Unternehmens geerdet bleiben, und wir sagen klar, wo RAG passt und wo nicht. Das Ziel sind Antworten, denen Menschen trauen, keine clevere Demo, die bei der zweiten Frage zerfällt.
Wollen Sie einen Assistenten, der aus Ihrem eigenen Wissen antwortet, nicht aus dem offenen Internet? Bauen wir ihn.
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Eine Marke in ein funktionierendes Geschäft verwandeln.
Eine halbe Million Menschen. Eine App. Null Chaos.















