Suralimenter les agents IA : comment Rexera transforme les clôtures immobilières avec Zilliz Cloud

augmentation de 40 %
en matière de précision de récupération grâce à la recherche hybride
Coût inférieur de 50 %
en éliminant Elasticsearch et en passant des bases de données vectorielles auto-hébergées à la plateforme entièrement gérée de Zilliz Cloud
Traitement des transactions en temps réel
est rendue possible par les performances de latence exceptionnelles de Zilliz Cloud
Complexité et charge de gestion réduites
en éliminant la nécessité d’une implémentation Elasticsearch distincte
Working with Zilliz Cloud has been transformative for our AI agent architecture. The hybrid search capability alone delivered a 40% accuracy improvement, and the scalability means we never worry about performance, even during the highest traffic periods. It's been essential to our continued growth.
Sasidhar Janaki
À propos de Rexera
Rexera ne se contente pas d’utiliser des agents d’IA : ils les ont opérationnalisés à grande échelle pour gérer l’un des flux de travail les plus complexes et les plus chargés en documents de l’immobilier : le processus de clôture. Avec des agents d’IA comme Iris qui gèrent plus de 10 000 tâches par jour et traitent des millions de pages par mois, Rexera a transformé ce qui était autrefois une opération très manuelle et sujette aux retards en un système intelligent, quasi en temps réel.
Mais faire passer des agents d’IA à l’échelle en production ne se résume pas à des prompts LLM : c’est une question d’architecture. L’intelligence documentaire en temps réel exige une récupération rapide et précise ainsi qu’une coordination autonome entre des agents qui extraient, valident et communiquent, le tout alimenté par des données constamment mises à jour et une infrastructure capable de monter en charge jusqu’à des millions de requêtes simultanées sans s’effondrer. C’est pourquoi Rexera s’est tourné vers Zilliz Cloud, une base de données vectorielle conçue spécifiquement pour les charges de travail d’IA, afin d’alimenter le cœur de son écosystème d’agents.
D’Iris, qui extrait et valide les données critiques, à Mia et Ria, qui automatisent les communications, les agents de Rexera s’appuient sur Zilliz Cloud pour fournir le contexte le plus pertinent — instantanément — grâce à la recherche hybride. Le résultat ? Une augmentation de 40 % de la précision de récupération, l’élimination d’une infrastructure fragile et une avancée majeure dans la façon dont les transactions immobilières sont clôturées.
Adopté par plus de 350 entreprises immobilières, Rexera redéfinit la manière dont les transactions se concluent — avec une IA qui fonctionne réellement à grande échelle.
Rexera's ai agents.png
Le défi : faire évoluer l’intelligence documentaire dans l’immobilier
À mesure que l’activité de Rexera s’est développée, l’entreprise a rencontré plusieurs défis critiques dans son pipeline de traitement documentaire.
Lorsque Rexera a été lancé, l’entreprise traitait des documents relativement simples — factures et certificats généralement inférieurs à 10 pages, qui pouvaient être transmis directement à de grands modèles de langage (LLM). Cependant, la croissance de l’activité les a rapidement amenés à analyser une documentation immobilière complète s’étendant sur des milliers de pages, dépassant largement les limites de fenêtre de contexte des LLM disponibles.
Leur solution initiale de base de données vectorielle, Deep Lake, stockait les embeddings dans des compartiments S3, mais souffrait d’importants goulets d’étranglement en matière de performance. Le système téléchargeait des ensembles vectoriels entiers sur leur serveur avant d’effectuer les calculs de similarité, créant une latence inacceptable. C’était intenable pour leur activité en croissance, et ils avaient besoin de toute urgence d’une nouvelle solution de recherche vectorielle.
Au départ, Rexera a envisagé d’auto-héberger Milvus sur son cluster Kubernetes, et cela fonctionnait très bien. Mais l’entreprise a reconnu la complexité opérationnelle liée à la maintenance d’un environnement de base de données vectorielle en production. La gestion de l’infrastructure nécessitait des ressources d’ingénierie spécialisées, en particulier pour gérer la mise à l’échelle élastique lors des pics de trafic, lorsque des millions de requêtes arrivaient simultanément. Leurs politiques de conservation des données, qui exigeaient la suppression des embeddings pour les transactions terminées, ajoutaient une couche supplémentaire de complexité opérationnelle. L’équipe a compris qu’elle avait besoin d’une solution qui éliminerait ces charges de gestion d’infrastructure tout en maintenant des performances élevées.
« Nous étions confrontés à des problèmes de latence et à des défis de mise à l’échelle avec nos solutions précédentes », explique Sasidhar Janaki, ingénieur logiciel senior chez Rexera, qui fait partie de l’entreprise depuis sa création. « Lorsque le trafic augmentait avec des millions de requêtes clients, notre infrastructure auto-hébergée ne parvenait pas à suivre, et la récupération des documents prenait trop de temps. »
La solution : alimenter les agents d’IA avec la base de données vectorielle Zilliz Cloud
Après une évaluation complète de plusieurs options de bases de données vectorielles, notamment Weaviate et Chroma, Rexera a choisi Zilliz Cloud comme fondation de son système d’intelligence documentaire, principalement pour sa latence supérieure, sa scalabilité et ses capacités de recherche hybride. Zilliz Cloud est devenu le référentiel central de connaissances alimentant plusieurs agents d’IA dans leur écosystème, tels que :
Iris – Extrait et valide les données issues de documents immobiliers complexes
Mia – Génère des réponses automatiques intelligentes aux e-mails sur la base de l’historique des communications
Ria – Fournit des réponses SMS automatisées pour tenir toutes les parties informées
Figure : Un exemple de la manière dont nos agents IA collaborent pour révolutionner l’acquisition de documents HOA
Pour chaque transaction, Rexera génère des embeddings pour des milliers de pages à l’aide du modèle text-embedding-3-large d’OpenAI et les stocke dans Zilliz Cloud. Ces embeddings sont continuellement mis à jour à mesure que le contenu des documents change, ce qui garantit que le système fonctionne toujours avec les informations les plus récentes.
Lorsqu’un agent doit récupérer des informations, il exploite la capacité de recherche hybride de Zilliz Cloud pour trouver le contenu le plus pertinent dans leur vaste référentiel de documents. Ce contexte récupéré est ensuite traité par plusieurs LLM, notamment ChatGPT et Claude, les réponses étant classées afin de déterminer si une intervention humaine est nécessaire.
L’introduction de la recherche hybride au sein de Zilliz Cloud a été particulièrement transformatrice, car elle a permis à Rexera de combiner la similarité vectorielle avec la recherche traditionnelle par mots-clés au sein d’une seule plateforme, éliminant ainsi leur besoin précédent de maintenir deux infrastructures de recherche distinctes.
Mise en œuvre et architecture
L’architecture d’agents IA de Rexera est un système modulaire, de qualité production, conçu pour l’automatisation des transactions à grande échelle. Au cœur du système se trouve Agent One, un orchestrateur centralisé alimenté par les frameworks LangChain et LangGraph, avec une observabilité assurée par LangSmith. Zilliz Cloud joue un rôle essentiel dans cet écosystème, en servant de base de données vectorielle haute performance permettant le raisonnement augmenté par récupération pour tous les agents.
L’intégration de Rexera avec Zilliz Cloud et d’autres outils d’IA suit un flux de travail rationalisé :
Figure : Comment Zilliz Cloud prend en charge le système d’agents IA de Rexera
Ingestion de documents + Embedding : À mesure que de nouveaux documents de transaction arrivent — des remboursements de prêts hypothécaires aux e-mails HOA — Rexera utilise des modèles OpenAI ou AWS Bedrock (via OpenRouter) pour encoder les documents en embeddings vectoriels. Ces embeddings, ainsi que des métadonnées telles que l’identifiant de commande, le type de document et l’identifiant de l’organisation, sont stockés dans Zilliz Cloud.
Orchestration des agents : Des agents spécialisés sont composés et orchestrés à l’aide des outils composables de LangChain et des workflows dynamiques de LangGraph. LangSmith fournit l’observabilité sur l’ensemble de la chaîne. Cette structure en couches permet un comportement d’agent affiné et explicable pour des tâches telles que l’automatisation des appels, l’automatisation web, l’analyse de documents, et plus encore.
Récupération contextuelle pour les agents IA via la recherche hybride : Lorsqu’un agent (par exemple Max, Mia, Iris) a besoin de contexte pour prendre une décision ou générer une sortie, Agent One exploite la recherche hybride de Zilliz Cloud — combinant recherche par similarité vectorielle, recherche plein texte et filtrage de métadonnées structurées — pour récupérer le contenu le plus pertinent parmi des milliers de pages en quelques millisecondes.
Vérification multi-modèle : Pour les transactions critiques, le contexte récupéré est transmis à plusieurs LLM, tels que Claude ou les modèles OpenAI GPT, afin de vérifier l’exactitude et de garantir une compréhension robuste et multiperspective.
Mises à jour en streaming vers Zilliz Cloud : À mesure que les documents évoluent au cours du cycle de vie de la transaction, les embeddings mis à jour sont continuellement envoyés en streaming vers Zilliz Cloud, garantissant que les résultats de récupération reflètent le dernier statut.
Ce système robuste, alimenté par Zilliz Cloud, permet à Rexera d’exécuter une flotte d’agents IA qui automatisent des transactions simultanées à forts enjeux avec rapidité, précision et explicabilité.
Pourquoi Rexera a choisi Zilliz Cloud
Le processus d’évaluation de Rexera incluait Deep Lake, Weaviate, Chroma, Milvus auto-hébergé et de nombreuses autres options de bases de données vectorielles. Plusieurs facteurs décisifs les ont amenés à choisir Zilliz Cloud :
Des performances de latence supérieures constituaient le principal critère. Zilliz Cloud a fourni les temps de réponse exceptionnels requis à la fois pour la récupération et le téléversement de documents, permettant un traitement des transactions quasi en temps réel.
Une scalabilité fluide s’est révélée essentielle pour l’activité de Rexera. Zilliz Cloud gère les pics de trafic lorsque des millions de demandes clients arrivent simultanément, sans les problèmes de mise à l’échelle rencontrés avec les solutions auto-hébergées.
La capacité de recherche hybride est devenue un véritable tournant pour le traitement documentaire de Rexera. Cette fonctionnalité a augmenté la précision de leur récupération de 40 % par rapport à la recherche traditionnelle basée sur les embeddings et a éliminé le besoin de maintenir des bases de données distinctes pour différents types de recherche.
Un workflow convivial pour les développeurs améliore la productivité. Les ingénieurs peuvent rapidement lancer des conteneurs Docker Milvus locaux pour les tests, puis se connecter sans friction à Zilliz Cloud dans les environnements de production.
« Lorsque Zilliz a annoncé que la recherche hybride serait incluse dans la plateforme, nous étions incroyablement enthousiastes », se souvient Sasidhar. « Nous avons obtenu un accès anticipé environ deux mois avant la sortie publique, et cela a été transformateur. Nous avons entièrement éliminé Elasticsearch et utilisons désormais Zilliz Cloud à la fois pour la recherche vectorielle et la recherche plein texte. »
Résultats et avantages du passage à Zilliz Cloud
Le passage de Rexera à Zilliz Cloud a apporté des gains de performance immédiats et des avantages architecturaux à long terme :
Augmentation de 40 % de la précision de récupération : La recherche hybride offerte par Zilliz Cloud garantit que les agents d’IA obtiennent toujours le bon contexte, même sur des milliers de pages, renforçant la précision dans l’ensemble des transactions.
Coût total réduit de 50 % : En éliminant Elasticsearch et en passant de bases de données vectorielles auto-hébergées à la plateforme entièrement managée de Zilliz Cloud, Rexera a réduit ses coûts d’infrastructure de près de moitié.
Latence 30 % meilleure que les alternatives : Par rapport aux autres bases de données vectorielles évaluées et testées par Rexera, Zilliz Cloud fournit systématiquement des réponses aux requêtes plus rapides, même sous charges de production.
Stack de recherche unique : En remplaçant Elasticsearch, Rexera a réduit la charge opérationnelle et simplifié son infrastructure.
Cycles de développement plus rapides : Les ingénieurs lancent désormais des conteneurs Milvus localement et déploient directement vers Zilliz Cloud en production—sans goulots d’étranglement, sans surprises.
Réponse en temps réel à grande échelle : La latence inférieure à la seconde de Zilliz Cloud permet une prise de décision en temps réel pour les clients, même lors des pics de volumes de demandes.
Gestion d’infrastructure nulle : Fini les efforts précipités pour mettre à l’échelle ou maintenir l’infrastructure vectorielle—Zilliz Cloud s’en charge, afin que Rexera puisse se concentrer sur l’innovation.
Projets futurs
Rexera ne fait que commencer. Alors que la demande des clients enterprise augmente, l’équipe prévoit de :
Activer la multi-tenance complète : Bien que la séparation basée sur les métadonnées fonctionne aujourd’hui, Rexera adoptera les fonctionnalités de multi-tenance de Zilliz Cloud pour prendre en charge une isolation stricte des données pour les grands clients.
Évaluer continuellement de nouveaux modèles : Les modèles d’embedding et de LLM sont constamment évalués par rapport à des charges de travail réelles afin de garantir des performances de premier ordre.
Étendre les capacités des agents : Avec la recherche vectorielle scalable comme fondation, Rexera explore de nouveaux comportements d’agents—de la synthèse dynamique aux workflows de conformité prédictive.
Conclusion
L’écosystème d’agents d’IA de Rexera montre ce qui est possible lorsque l’infrastructure vectorielle est conçue pour évoluer—et non assemblée de façon précaire. En standardisant sur Zilliz Cloud, l’entreprise a débloqué une intelligence en temps réel tout au long du processus de clôture, éliminé une infrastructure fragile et gagné une voie fiable pour se développer.
« La recherche hybride nous a apporté un gain de précision de 40 %. Nous avons éliminé Elasticsearch. Et nous ne nous posons plus de questions sur la mise à l’échelle. Zilliz Cloud a rendu tout cela possible. »
—Sasidhar Janaki, Senior Software Engineer, Rexera
We were facing latency issues and scaling challenges with our previous solutions. When traffic spiked with millions of customer requests, our self-hosted infrastructure couldn't keep up, and document retrieval was taking too long.
Sasidhar Janaki


