AI 에이전트의 성능을 극대화하기: Rexera가 Zilliz Cloud로 부동산 클로징을 혁신하는 방법

40% 증가
하이브리드 검색을 통한 검색 정확도에서
50% 더 낮은 비용
Elasticsearch를 제거하고 자체 호스팅 벡터 데이터베이스에서 Zilliz Cloud의 완전 관리형 플랫폼으로 전환함으로써
실시간 트랜잭션 처리
Zilliz Cloud의 탁월한 지연 시간 성능을 통해 실현됩니다
복잡성과 관리 오버헤드 감소
별도의 Elasticsearch 구현이 필요하지 않도록 하여
Working with Zilliz Cloud has been transformative for our AI agent architecture. The hybrid search capability alone delivered a 40% accuracy improvement, and the scalability means we never worry about performance, even during the highest traffic periods. It's been essential to our continued growth.
Sasidhar Janaki
Rexera 소개
Rexera는 단순히 AI 에이전트를 사용하는 데 그치지 않습니다. 부동산에서 가장 복잡하고 문서 집약적인 워크플로 중 하나인 클로징 프로세스를 처리하기 위해 이를 대규모로 운영화했습니다. Iris와 같은 AI 에이전트가 매일 10,000개 이상의 작업을 관리하고 매월 수백만 페이지를 처리하면서, Rexera는 한때 수작업이 많고 지연이 잦았던 운영을 지능적이고 거의 실시간에 가까운 시스템으로 전환했습니다.
하지만 프로덕션에서 AI 에이전트를 확장하는 것은 단순히 LLM 프롬프트에 관한 문제가 아니라 아키텍처에 관한 문제입니다. 실시간 문서 인텔리전스에는 빠르고 정확한 검색과, 추출·검증·커뮤니케이션을 수행하는 에이전트 간의 자율적 조율이 필요합니다. 이 모든 것은 지속적으로 업데이트되는 데이터와, 수백만 건의 동시 요청 급증에도 무너지지 않는 인프라를 기반으로 합니다. 이것이 Rexera가 에이전트 생태계의 핵심을 구동하기 위해 AI 워크로드에 특화된 벡터 데이터베이스인 Zilliz Cloud를 선택한 이유입니다.
중요 데이터를 추출하고 검증하는 Iris부터 커뮤니케이션을 자동화하는 Mia와 Ria까지, Rexera의 에이전트들은 하이브리드 검색을 통해 가장 관련성 높은 컨텍스트를 즉시 제공하기 위해 Zilliz Cloud에 의존합니다. 그 결과는 무엇일까요? 검색 정확도 40% 향상, 취약한 인프라 제거, 그리고 부동산 거래가 클로징되는 방식의 큰 도약입니다.
350개 이상의 부동산 회사가 신뢰하는 Rexera는 실제로 대규모로 작동하는 AI로 거래 성사 방식을 재정의하고 있습니다.
Rexera's ai agents.png
과제: 부동산 문서 인텔리전스의 확장
Rexera의 비즈니스가 확장되면서, 그들은 문서 처리 파이프라인에서 몇 가지 중요한 과제에 직면했습니다.
Rexera가 처음 출시되었을 때는 비교적 단순한 문서, 즉 일반적으로 10페이지 미만의 인보이스와 인증서를 처리했으며, 이는 대규모 언어 모델(LLM)에 직접 입력할 수 있었습니다. 그러나 비즈니스 성장으로 인해 곧 수천 페이지에 이르는 포괄적인 부동산 문서를 분석해야 했고, 이는 사용 가능한 LLM의 컨텍스트 창 제한을 훨씬 초과했습니다.
초기 벡터 데이터베이스 솔루션인 Deep Lake는 임베딩을 S3 버킷에 저장했지만 심각한 성능 병목 현상을 겪었습니다. 시스템은 유사도 계산을 수행하기 전에 전체 벡터 세트를 서버로 다운로드했으며, 이로 인해 용납할 수 없는 지연 시간이 발생했습니다. 이는 성장하는 비즈니스에 받아들일 수 없는 일이었고, 그들은 새로운 벡터 검색 솔루션이 시급히 필요했습니다.
처음에 Rexera는 Kubernetes 클러스터에서 Milvus를 자체 호스팅하는 방안을 검토했고, 이는 매우 잘 작동했습니다. 하지만 그들은 프로덕션 벡터 데이터베이스 환경을 유지 관리하는 데 따르는 운영 복잡성을 인식했습니다. 인프라 관리는 특히 수백만 건의 요청이 동시에 도착하는 트래픽 급증 시 탄력적 확장을 처리하기 위해 전문 엔지니어링 리소스를 필요로 했습니다. 완료된 거래의 임베딩을 삭제해야 하는 데이터 보존 정책은 또 다른 운영 복잡성을 더했습니다. 팀은 높은 성능을 유지하면서 이러한 인프라 관리 부담을 없애줄 솔루션이 필요하다는 것을 깨달았습니다.
"우리는 이전 솔루션에서 지연 시간 문제와 확장 과제에 직면하고 있었습니다."라고 회사 설립 초기부터 함께해 온 Rexera의 시니어 소프트웨어 엔지니어 Sasidhar Janaki는 설명합니다. "수백만 건의 고객 요청으로 트래픽이 급증했을 때, 자체 호스팅 인프라는 이를 따라가지 못했고 문서 검색에 너무 오랜 시간이 걸렸습니다."
솔루션: Zilliz Cloud Vector Database로 AI 에이전트 구동
Weaviate와 Chroma를 포함한 여러 벡터 데이터베이스 옵션을 포괄적으로 평가한 후, Rexera는 우수한 지연 시간, 확장성, 하이브리드 검색 기능을 주된 이유로 문서 인텔리전스 시스템의 기반으로 Zilliz Cloud를 선택했습니다. Zilliz Cloud는 다음과 같은 생태계 내 여러 AI 에이전트를 구동하는 중앙 지식 저장소가 되었습니다.
Iris – 복잡한 부동산 문서에서 데이터를 추출하고 검증합니다
Mia – 커뮤니케이션 기록을 기반으로 지능형 이메일 자동 답장을 생성합니다
Ria – 모든 관계자가 정보를 계속 파악할 수 있도록 자동화된 SMS 응답을 제공합니다
그림: HOA 문서 확보를 혁신하기 위해 당사의 AI 에이전트들이 함께 작동하는 방식의 예
각 거래마다 Rexera는 OpenAI의 text-embedding-3-large 모델을 사용해 수천 페이지에 대한 임베딩을 생성하고 이를 Zilliz Cloud에 저장합니다. 이러한 임베딩은 문서 내용이 변경됨에 따라 지속적으로 업데이트되어, 시스템이 항상 최신 정보를 기반으로 작동하도록 보장합니다.
에이전트가 정보를 검색해야 할 때는 Zilliz Cloud의 하이브리드 검색 기능을 활용해 방대한 문서 저장소에서 가장 관련성 높은 콘텐츠를 찾습니다. 이렇게 검색된 컨텍스트는 ChatGPT와 Claude를 포함한 여러 LLM에 의해 처리되며, 답변은 인간의 개입이 필요한지 판단하기 위해 순위가 매겨집니다.
Zilliz Cloud 내 하이브리드 검색의 도입은 특히 혁신적이었습니다. Rexera가 벡터 유사도와 기존 키워드 검색을 단일 플랫폼에서 결합할 수 있게 되어, 이전에 두 개의 별도 검색 인프라를 유지해야 했던 필요가 사라졌기 때문입니다.
구현 및 아키텍처
Rexera의 AI 에이전트 아키텍처는 대규모 거래 자동화를 위해 구축된 모듈식 프로덕션급 시스템입니다. 그 핵심에는 LangChain 및 LangGraph 프레임워크로 구동되는 중앙 집중식 오케스트레이터인 Agent One이 있으며, 관측 가능성은 LangSmith가 제공합니다. Zilliz Cloud는 이 생태계에서 핵심적인 역할을 수행하며, 모든 에이전트 전반에서 검색 증강 추론을 가능하게 하는 고성능 벡터 데이터베이스 역할을 합니다.
Rexera의 Zilliz Cloud 및 기타 AI 도구와의 통합은 간소화된 워크플로를 따릅니다:
그림: Zilliz Cloud가 Rexera의 AI Agents 시스템을 지원하는 방식
문서 수집 + 임베딩: 모기지 상환 명세서부터 HOA 이메일에 이르기까지 새로운 거래 문서가 도착하면, Rexera는 OpenAI 또는 AWS Bedrock 모델(OpenRouter를 통해)을 사용해 문서를 벡터 임베딩으로 인코딩합니다. 이러한 임베딩은 주문 ID, 문서 유형, 조직 ID와 같은 메타데이터와 함께 Zilliz Cloud에 저장됩니다.
에이전트 오케스트레이션: 전문 에이전트들은 LangChain의 조합 가능한 도구와 LangGraph의 동적 워크플로를 사용해 구성되고 오케스트레이션됩니다. LangSmith는 체인 전반의 관측 가능성을 제공합니다. 이러한 계층형 구조는 통화 자동화, 웹 자동화, 문서 분석 등 다양한 작업에서 정교하게 조정되고 설명 가능한 에이전트 동작을 가능하게 합니다.
하이브리드 검색을 통한 AI 에이전트용 컨텍스트 검색: 에이전트(예: Max, Mia, Iris)가 결정을 내리거나 출력을 생성하기 위해 컨텍스트가 필요할 때, Agent One은 벡터 유사도 검색, 전체 텍스트 검색, 구조화된 메타데이터 필터링을 결합한 Zilliz Cloud의 하이브리드 검색을 활용하여 수천 페이지 전반에서 가장 관련성 높은 콘텐츠를 밀리초 단위로 검색합니다.
멀티 모델 검증: 중요한 거래의 경우, 검색된 컨텍스트는 Claude 또는 OpenAI GPT 모델과 같은 여러 LLM을 통해 전달되어 정확성을 검증하고 견고한 다각적 이해를 보장합니다.
Zilliz Cloud로의 스트리밍 업데이트: 거래 수명주기 전반에 걸쳐 문서가 변화함에 따라, 업데이트된 임베딩은 지속적으로 Zilliz Cloud로 스트리밍되어 검색 결과가 최신 상태를 반영하도록 보장합니다.
이 견고한 Zilliz Cloud 기반 시스템을 통해 Rexera는 속도, 정확성, 설명 가능성을 갖추고 고위험 동시 거래를 자동화하는 AI 에이전트 군단을 운영할 수 있습니다.
Rexera가 Zilliz Cloud를 선택한 이유
Rexera의 평가 과정에는 Deep Lake, Weaviate, Chroma, 자체 호스팅 Milvus, 그리고 그 외 많은 벡터 데이터베이스 옵션이 포함되었습니다. 몇 가지 결정적인 요인이 Zilliz Cloud를 선택하게 만들었습니다:
뛰어난 지연 시간 성능이 가장 중요한 고려 사항이었습니다. Zilliz Cloud는 문서 검색과 업로드 모두에 필요한 탁월한 응답 시간을 제공하여 거의 실시간에 가까운 트랜잭션 처리를 가능하게 했습니다.
원활한 확장성은 Rexera의 비즈니스에 매우 중요했습니다. Zilliz Cloud는 수백만 건의 고객 요청이 동시에 몰리는 트래픽 급증 상황에서도, 자체 호스팅 솔루션에서 겪었던 확장 문제 없이 이를 처리합니다.
하이브리드 검색 기능은 Rexera의 문서 처리에 획기적인 전환점이 되었습니다. 이 기능은 기존 임베딩 기반 검색과 비교해 검색 정확도를 40% 높였고, 서로 다른 검색 유형을 위해 별도의 데이터베이스를 유지할 필요를 없앴습니다.
개발자 친화적인 워크플로는 생산성을 높입니다. 엔지니어는 테스트를 위해 로컬 Milvus Docker 컨테이너를 빠르게 띄운 뒤, 프로덕션 환경에서 Zilliz Cloud에 원활하게 연결할 수 있습니다.
"Zilliz가 하이브리드 검색이 플랫폼에 포함될 것이라고 발표했을 때, 우리는 정말 흥분했습니다."라고 Sasidhar는 회상합니다. "공개 출시 약 두 달 전에 얼리 액세스를 받았고, 그것은 혁신적이었습니다. 우리는 Elasticsearch를 완전히 제거했고, 이제 벡터 검색과 전체 텍스트 검색 모두에 Zilliz Cloud를 사용합니다."
Zilliz Cloud로 전환한 결과와 이점
Rexera가 Zilliz Cloud로 전환하면서 즉각적인 성능 향상과 장기적인 아키텍처 이점을 얻었습니다:
검색 정확도 40% 증가: Zilliz Cloud가 제공하는 하이브리드 검색은 수천 페이지에 걸쳐서도 AI 에이전트가 항상 올바른 컨텍스트를 얻도록 보장하여 트랜잭션 전반의 정밀도를 높입니다.
총비용 50% 절감: Elasticsearch를 제거하고 자체 호스팅 벡터 데이터베이스에서 Zilliz Cloud의 완전 관리형 플랫폼으로 전환함으로써, Rexera는 인프라 비용을 거의 절반으로 줄였습니다.
대안 대비 30% 더 낮은 지연 시간: Rexera가 평가하고 시도한 다른 벡터 데이터베이스와 비교했을 때, Zilliz Cloud는 프로덕션 부하 상황에서도 일관되게 더 빠른 쿼리 응답을 제공합니다.
단일 검색 스택: Elasticsearch를 대체함으로써, Rexera는 운영 오버헤드를 줄이고 인프라를 단순화했습니다.
더 빠른 개발 주기: 엔지니어는 이제 로컬에서 Milvus 컨테이너를 띄우고 프로덕션에서 Zilliz Cloud로 바로 푸시합니다—병목도, 예기치 못한 문제도 없습니다.
대규모 실시간 응답: Zilliz Cloud의 초 단위 미만 지연 시간은 요청량이 최고조에 달할 때에도 고객을 위한 실시간 의사결정을 가능하게 합니다.
인프라 관리 제로: 더 이상 벡터 인프라를 확장하거나 유지관리하기 위해 허둥댈 필요가 없습니다—Zilliz Cloud가 이를 처리하므로 Rexera는 혁신에 집중할 수 있습니다.
향후 계획
Rexera는 이제 막 시작했을 뿐입니다. 엔터프라이즈 고객의 수요가 증가함에 따라, 팀은 다음을 계획하고 있습니다:
완전한 멀티테넌시 지원: 현재는 메타데이터 기반 분리가 작동하고 있지만, Rexera는 대형 고객을 위한 엄격한 데이터 격리를 지원하기 위해 Zilliz Cloud의 멀티테넌시 기능을 도입할 예정입니다.
새로운 모델의 지속적인 평가: 임베딩 및 LLM 모델은 최고 수준의 성능을 보장하기 위해 실제 워크로드를 기준으로 지속적으로 벤치마킹됩니다.
에이전트 기능 확장: 확장 가능한 벡터 검색을 기반으로, Rexera는 동적 요약부터 예측형 컴플라이언스 워크플로에 이르기까지 새로운 에이전트 동작을 탐색하고 있습니다.
결론
Rexera의 AI 에이전트 생태계는 벡터 인프라가 임시로 이어 붙인 것이 아니라 확장을 위해 구축될 때 무엇이 가능한지를 보여줍니다. Zilliz Cloud로 표준화함으로써, Rexera는 클로징 프로세스 전반에서 실시간 인텔리전스를 구현하고, 취약한 인프라를 제거했으며, 확장을 위한 신뢰할 수 있는 경로를 확보했습니다.
“하이브리드 검색은 우리에게 40%의 정확도 향상을 가져다주었습니다. 우리는 Elasticsearch를 제거했습니다. 그리고 확장에 대해 두 번 생각하지 않습니다. Zilliz Cloud가 이 모든 것을 가능하게 했습니다.”
—Sasidhar Janaki, Senior Software Engineer, Rexera
We were facing latency issues and scaling challenges with our previous solutions. When traffic spiked with millions of customer requests, our self-hosted infrastructure couldn't keep up, and document retrieval was taking too long.
Sasidhar Janaki


