벡터 데이터베이스에서 벡터 레이크베이스로

May, 2026

벡터 데이터베이스에서 벡터 레이크베이스로

프로덕션 AI 시스템은 동시에 둘 이상의 워크로드를 실행합니다. 라이브 서빙에는 1000+ QPS에서 한 자릿수 밀리초 검색이 필요합니다. 그 뒤에서는 동일한 데이터가 오프라인 작업 — 의미론적 중복 제거, 클러스터링, 데이터셋 큐레이션, 그리고 피드백과 로그에 대한 품질 분석 — 을 위해 채굴되며, 규모는 한 자릿수에서 세 자릿수까지 더 크고 대부분의 시간에는 유휴 상태입니다. 대부분의 팀은 이를 별도의 시스템, 별도의 파이프라인, 별도의 스토리지에 걸쳐 이어 붙입니다. 데이터 모델이 진화할 때마다 복잡성은 누적됩니다.

Vector Lakebase는 Zilliz Cloud의 다음 장입니다. 하나의 S3 기반 데이터 플레인이 멀티모달 데이터, 벡터, 인덱스를 한 번만 보관하고, 세 가지 컴퓨트 모드 — 실시간 서빙, 반복적 탐색, 배치 분석 — 가 이를 제로 카피로 읽습니다. 벡터 검색은 대체되는 것이 아니라, AI 데이터 루프의 나머지 부분을 위해 구축된 기반 위로 확장됩니다.

가이드에 포함된 내용

하나의 데이터 플레인, 세 가지 워크로드 모드 — 그리고 벡터 데이터베이스만으로는 더 이상 AI 루프를 포괄할 수 없는 이유
Vector Lakebase를 정의하는 다섯 가지 기능, 여기에는 서버리스 비용의 약 1/15 수준인 온디맨드 검색과 기존 레이크에 대한 제로 카피 인덱싱이 포함됩니다
이미 프로덕션에서 실행 중인 사례 — 에이전트 지식 베이스, 웹 규모 검색, 코퍼스 중복 제거, 학습 세트 준비

Zilliz의 제품 VP이자 Milvus의 설계자 중 한 명인 Robert Guo 작성.

백서 받기