KI-Agenten aufladen: Wie Rexera Immobilienabschlüsse mit Zilliz Cloud transformiert

40 % Steigerung
bei der Abrufgenauigkeit durch hybride Suche
50 % niedrigere Kosten
durch die Abschaffung von Elasticsearch und den Wechsel von selbst gehosteten Vektordatenbanken zur vollständig verwalteten Plattform von Zilliz Cloud
Echtzeit-Transaktionsverarbeitung
wird durch die außergewöhnliche Latenzleistung von Zilliz Cloud ermöglicht
Reduzierte Komplexität und geringerer Verwaltungsaufwand
indem die Notwendigkeit einer separaten Elasticsearch-Implementierung entfällt
Working with Zilliz Cloud has been transformative for our AI agent architecture. The hybrid search capability alone delivered a 40% accuracy improvement, and the scalability means we never worry about performance, even during the highest traffic periods. It's been essential to our continued growth.
Sasidhar Janaki
Über Rexera
Rexera nutzt nicht einfach nur KI-Agenten – sie haben sie in großem Maßstab operationalisiert, um einen der komplexesten, dokumentenintensivsten Workflows in der Immobilienbranche zu bewältigen: den Closing-Prozess. Mit KI-Agenten wie Iris, die täglich über 10.000 Aufgaben verwaltet und Millionen von Seiten pro Monat verarbeitet, hat Rexera einen einst manuell intensiven und verzögerungsanfälligen Vorgang in ein intelligentes, nahezu echtzeitfähiges System verwandelt.
Doch die Skalierung von KI-Agenten in der Produktion dreht sich nicht nur um LLM-Prompts – es geht um Architektur. Echtzeit-Dokumentenintelligenz erfordert schnellen, präzisen Abruf und autonome Koordination zwischen Agenten, die extrahieren, validieren und kommunizieren – alles angetrieben durch ständig aktualisierte Daten und eine Infrastruktur, die auf Millionen gleichzeitiger Anfragen anwachsen kann, ohne auszufallen. Deshalb wandte sich Rexera an Zilliz Cloud, eine speziell für KI-Workloads entwickelte Vektordatenbank, um den Kern seines Agenten-Ökosystems zu betreiben.
Von Iris, die kritische Daten extrahiert und validiert, bis hin zu Mia und Ria, die die Kommunikation automatisieren, verlassen sich die Agenten von Rexera auf Zilliz Cloud, um den relevantesten Kontext – sofort – durch hybride Suche bereitzustellen. Das Ergebnis? Eine Steigerung der Abrufgenauigkeit um 40 %, die Beseitigung fragiler Infrastruktur und ein großer Fortschritt dabei, wie Immobilientransaktionen abgeschlossen werden.
Rexera, dem mehr als 350 Immobilienfirmen vertrauen, definiert neu, wie Deals abgeschlossen werden – mit KI, die tatsächlich in großem Maßstab funktioniert.
Rexera's ai agents.png
Die Herausforderung: Skalierung von Dokumentenintelligenz im Immobilienbereich
Als Rexeras Geschäft expandierte, stießen sie in ihrer Dokumentenverarbeitungspipeline auf mehrere kritische Herausforderungen.
Als Rexera erstmals startete, verarbeiteten sie relativ einfache Dokumente – Rechnungen und Zertifikate, typischerweise unter 10 Seiten, die direkt in Large Language Models (LLMs) eingespeist werden konnten. Das Geschäftswachstum erforderte jedoch bald die Analyse umfassender Immobiliendokumentationen mit Tausenden von Seiten, was die Kontextfensterbeschränkungen der verfügbaren LLMs bei Weitem überschritt.
Ihre anfängliche Vektordatenbanklösung, Deep Lake, speicherte Embeddings in S3-Buckets, litt jedoch unter erheblichen Leistungsengpässen. Das System lud ganze Vektorsätze auf ihren Server herunter, bevor Ähnlichkeitsberechnungen durchgeführt wurden, was inakzeptable Latenzen verursachte. Dies war für ihr wachsendes Geschäft nicht tragbar, und sie benötigten dringend eine neue Vektorsuchlösung.
Zunächst untersuchte Rexera das Self-Hosting von Milvus auf ihrem Kubernetes-Cluster, und es funktionierte sehr gut. Doch sie erkannten die operative Komplexität, die mit der Wartung einer produktiven Vektordatenbankumgebung einhergeht. Die Verwaltung der Infrastruktur erforderte spezialisierte Engineering-Ressourcen, insbesondere für die Handhabung elastischer Skalierung während Traffic-Spitzen, wenn Millionen von Anfragen gleichzeitig eintrafen. Ihre Datenaufbewahrungsrichtlinien, die das Löschen von Embeddings für abgeschlossene Transaktionen erforderten, fügten eine weitere Ebene operativer Komplexität hinzu. Das Team erkannte, dass es eine Lösung benötigte, die diese Belastungen durch Infrastrukturmanagement beseitigen und gleichzeitig hohe Leistung aufrechterhalten würde.
„Wir hatten mit unseren vorherigen Lösungen Latenzprobleme und Skalierungsherausforderungen“, erklärt Sasidhar Janaki, Senior Software Engineer bei Rexera, der seit der Gründung des Unternehmens dabei ist. „Wenn der Traffic mit Millionen von Kundenanfragen anstieg, konnte unsere selbst gehostete Infrastruktur nicht mithalten, und der Dokumentenabruf dauerte zu lange.“
Die Lösung: KI-Agenten mit der Zilliz Cloud-Vektordatenbank betreiben
Nach einer umfassenden Bewertung mehrerer Vektordatenbankoptionen, darunter Weaviate und Chroma, wählte Rexera Zilliz Cloud als Grundlage für ihr Dokumentenintelligenzsystem aus, vor allem wegen ihrer überlegenen Latenz, Skalierbarkeit und hybriden Suchfunktionen. Zilliz Cloud wurde zum zentralen Wissensspeicher, der mehrere KI-Agenten in ihrem Ökosystem antreibt, wie zum Beispiel:
Iris – Extrahiert und validiert Daten aus komplexen Immobiliendokumentationen
Mia – Generiert intelligente automatische E-Mail-Antworten auf Basis des Kommunikationsverlaufs
Ria – Bietet automatisierte SMS-Antworten, um alle Parteien auf dem Laufenden zu halten
Abbildung: Ein Beispiel dafür, wie unsere KI-Agenten zusammenarbeiten, um die Beschaffung von HOA-Dokumenten zu revolutionieren
Für jede Transaktion generiert Rexera mithilfe des Modells text-embedding-3-large von OpenAI Embeddings für Tausende von Seiten und speichert sie in Zilliz Cloud. Diese Embeddings werden kontinuierlich aktualisiert, wenn sich Dokumentinhalte ändern, sodass das System stets mit den aktuellsten Informationen arbeitet.
Wenn ein Agent Informationen abrufen muss, nutzt er die hybride Suchfunktion von Zilliz Cloud, um die relevantesten Inhalte aus ihrem umfangreichen Dokumenten-Repository zu finden. Dieser abgerufene Kontext wird anschließend von mehreren LLMs, darunter ChatGPT und Claude, verarbeitet, wobei die Antworten bewertet werden, um festzustellen, ob menschliches Eingreifen erforderlich ist.
Die Einführung der hybriden Suche innerhalb von Zilliz Cloud war besonders transformativ, da sie Rexera ermöglichte, Vektorähnlichkeit mit traditioneller Keyword-Suche auf einer einzigen Plattform zu kombinieren, wodurch die bisherige Notwendigkeit entfiel, zwei separate Suchinfrastrukturen zu betreiben.
Implementierung und Architektur
Rexeras KI-Agentenarchitektur ist ein modulares, produktionstaugliches System, das für Transaktionsautomatisierung in großem Maßstab entwickelt wurde. Im Zentrum steht Agent One, ein zentralisierter Orchestrator, der von den Frameworks LangChain und LangGraph unterstützt wird, mit Observability durch LangSmith. Zilliz Cloud spielt in diesem Ökosystem eine entscheidende Rolle und dient als leistungsstarke Vektordatenbank, die retrieval-augmentiertes Reasoning über alle Agenten hinweg ermöglicht.
Rexeras Integration mit Zilliz Cloud und anderen KI-Tools folgt einem optimierten Workflow:
Abbildung: Wie Zilliz Cloud Rexeras KI-Agentensystem unterstützt
Dokumentenaufnahme + Embedding: Wenn neue Transaktionsdokumente eintreffen – von Hypothekenablösungen bis hin zu HOA-E-Mails – verwendet Rexera OpenAI- oder AWS-Bedrock-Modelle (über OpenRouter), um Dokumente in Vektor-Embeddings zu kodieren. Diese Embeddings werden zusammen mit Metadaten wie Auftrags-ID, Dokumenttyp und Organisations-ID in Zilliz Cloud gespeichert.
Agenten-Orchestrierung: Spezialisierte Agenten werden mithilfe der zusammensetzbaren Tools von LangChain und der dynamischen Workflows von LangGraph zusammengestellt und orchestriert. LangSmith bietet Observability über die gesamte Chain hinweg. Diese geschichtete Struktur ermöglicht fein abgestimmtes, erklärbares Agentenverhalten über Aufgaben wie Anrufautomatisierung, Webautomatisierung, Dokumentenanalyse und mehr hinweg.
Kontextueller Abruf für KI-Agenten über hybride Suche: Wenn ein Agent (z. B. Max, Mia, Iris) Kontext benötigt, um eine Entscheidung zu treffen oder eine Ausgabe zu generieren, nutzt Agent One die hybride Suche von Zilliz Cloud – eine Kombination aus Vektorähnlichkeitssuche, Volltextsuche und strukturierter Metadatenfilterung –, um die relevantesten Inhalte über Tausende von Seiten hinweg in Millisekunden abzurufen.
Multi-Model-Verifizierung: Bei kritischen Transaktionen wird der abgerufene Kontext durch mehrere LLMs, wie Claude oder OpenAI-GPT-Modelle, geleitet, um die Genauigkeit zu überprüfen und ein robustes, multiperspektivisches Verständnis sicherzustellen.
Streaming-Updates zu Zilliz Cloud: Während sich Dokumente im Laufe des Transaktionslebenszyklus weiterentwickeln, werden aktualisierte Embeddings kontinuierlich in Zilliz Cloud gestreamt, sodass die Abrufresultate den neuesten Status widerspiegeln.
Dieses robuste, von Zilliz Cloud unterstützte System ermöglicht es Rexera, eine Flotte von KI-Agenten zu betreiben, die gleichzeitige Transaktionen mit hohen Einsätzen mit Geschwindigkeit, Genauigkeit und Erklärbarkeit automatisieren.
Warum Rexera sich für Zilliz Cloud entschieden hat
Der Evaluierungsprozess von Rexera umfasste Deep Lake, Weaviate, Chroma, selbst gehostetes Milvus und viele weitere Vektordatenbankoptionen. Mehrere entscheidende Faktoren führten dazu, dass sie sich für Zilliz Cloud entschieden:
Überlegene Latenzleistung war die wichtigste Überlegung. Zilliz Cloud lieferte die außergewöhnlichen Antwortzeiten, die sowohl für den Dokumentenabruf als auch für Uploads erforderlich sind, und ermöglichte so eine Transaktionsverarbeitung nahezu in Echtzeit.
Nahtlose Skalierbarkeit erwies sich als entscheidend für das Geschäft von Rexera. Zilliz Cloud bewältigt Traffic-Spitzen, wenn Millionen von Kundenanfragen gleichzeitig eintreffen, ohne die Skalierungsprobleme, die sie bei selbst gehosteten Lösungen erlebt hatten.
Hybride Suchfunktionalität wurde zu einem entscheidenden Vorteil für die Dokumentenverarbeitung von Rexera. Diese Funktion steigerte ihre Abrufgenauigkeit um 40 % im Vergleich zur traditionellen embedding-basierten Suche und machte es überflüssig, separate Datenbanken für verschiedene Suchtypen zu pflegen.
Entwicklerfreundlicher Workflow steigert die Produktivität. Ingenieure können schnell lokale Milvus Docker-Container zum Testen hochfahren und sich anschließend nahtlos mit Zilliz Cloud in Produktionsumgebungen verbinden.
„Als Zilliz ankündigte, dass hybride Suche in die Plattform aufgenommen würde, waren wir unglaublich begeistert“, erinnert sich Sasidhar. „Wir erhielten etwa zwei Monate vor der öffentlichen Veröffentlichung Early Access, und es war transformativ. Wir haben Elasticsearch vollständig eliminiert und nutzen jetzt Zilliz Cloud sowohl für Vektor- als auch für Volltextsuche.“
Ergebnisse und Vorteile des Wechsels zu Zilliz Cloud
Rexeras Wechsel zu Zilliz Cloud brachte sofortige Leistungsgewinne und langfristige architektonische Vorteile:
40 % höhere Abrufgenauigkeit: Die von Zilliz Cloud angebotene hybride Suche stellt sicher, dass KI-Agenten immer den richtigen Kontext erhalten, selbst über Tausende von Seiten hinweg, und erhöht so die Präzision bei Transaktionen.
50 % niedrigere Gesamtkosten: Durch die Eliminierung von Elasticsearch und den Wechsel von selbst gehosteten Vektordatenbanken zur vollständig verwalteten Plattform von Zilliz Cloud senkte Rexera die Infrastrukturkosten nahezu um die Hälfte.
30 % bessere Latenz als Alternativen: Im Vergleich zu anderen Vektordatenbanken, die Rexera evaluiert und ausprobiert hat, liefert Zilliz Cloud durchweg schnellere Abfrageantworten, selbst unter Produktionslasten.
Einheitlicher Search Stack: Durch den Ersatz von Elasticsearch reduzierte Rexera den operativen Aufwand und vereinfachte seine Infrastruktur.
Schnellere Entwicklungszyklen: Ingenieure fahren nun Milvus-Container lokal hoch und pushen direkt zu Zilliz Cloud in der Produktion—keine Engpässe, keine Überraschungen.
Echtzeitreaktion in großem Maßstab: Die Latenz von Zilliz Cloud im Subsekundenbereich ermöglicht Kunden Entscheidungen in Echtzeit, selbst bei Spitzenvolumen an Anfragen.
Kein Infrastrukturmanagement: Kein hektisches Skalieren oder Warten der Vektorinfrastruktur mehr—Zilliz Cloud übernimmt das, damit Rexera sich auf Innovation konzentrieren kann.
Zukunftspläne
Rexera steht erst am Anfang. Da die Nachfrage von Unternehmenskunden wächst, plant das Team:
Vollständige Mandantenfähigkeit ermöglichen: Während die metadatenbasierte Trennung heute funktioniert, wird Rexera die Multi-Tenancy-Funktionen von Zilliz Cloud übernehmen, um strikte Datenisolierung für große Kunden zu unterstützen.
Neue Modelle kontinuierlich evaluieren: Embedding- und LLM-Modelle werden ständig anhand realer Workloads benchmarked, um erstklassige Leistung sicherzustellen.
Agentenfähigkeiten erweitern: Mit skalierbarer Vektorsuche als Grundlage erkundet Rexera neue Agentenverhalten—von dynamischer Zusammenfassung bis hin zu prädiktiven Compliance-Workflows.
Fazit
Rexeras KI-Agenten-Ökosystem zeigt, was möglich ist, wenn Vektorinfrastruktur für Skalierung gebaut ist—nicht zusammengeflickt. Durch die Standardisierung auf Zilliz Cloud haben sie Echtzeitintelligenz über den gesamten Closing-Prozess hinweg freigesetzt, fragile Infrastruktur eliminiert und einen verlässlichen Weg zur Expansion gewonnen.
„Hybride Suche hat uns eine Genauigkeitssteigerung von 40 % gebracht. Wir haben Elasticsearch eliminiert. Und über Skalierung denken wir nicht zweimal nach. Zilliz Cloud hat all das möglich gemacht.“
—Sasidhar Janaki, Senior Software Engineer, Rexera
We were facing latency issues and scaling challenges with our previous solutions. When traffic spiked with millions of customer requests, our self-hosted infrastructure couldn't keep up, and document retrieval was taking too long.
Sasidhar Janaki


