DocsGPT and Zilliz Cloud Integration
Integrate Zilliz Cloud with DocsGPT to build a documentation Q&A system that retrieves accurate, GPT-powered answers from your project docs. Use Milvus as the vector database backend to store and search document embeddings at scale, with minimal configuration and no vector infrastructure to manage.
무료로 이 통합 기능 사용DocsGPT란 무엇인가요?
DocsGPT는 개발자가 프로젝트 문서에 대해 자연어로 질문하고 GPT 기반의 정확한 답변을 받을 수 있게 해주는 오픈소스 솔루션입니다. 사용자는 문서를 수동으로 검색하는 대신 일반 영어로 쿼리하고 실제 원본 자료에 기반한 직접적인 응답을 받습니다. DocsGPT는 최소한의 설정으로 기존 프로젝트에 쉽게 도입할 수 있도록 구축되었습니다 — 단일 Docker화된 애플리케이션에서 문서 수집, 임베딩, 검색, 답변 생성을 처리합니다.
Zilliz Cloud(완전 관리형 Milvus)를 DocsGPT와 통합하면, 벡터 데이터베이스 인프라를 직접 관리하지 않고도 문서가 늘어남에 따라 검색을 빠르고 정확하게 유지하면서 문서 임베딩을 대규모로 저장하고 검색할 수 있습니다.
DocsGPT + Zilliz Cloud 통합의 이점
- 실제 문서에 기반한 답변. DocsGPT는 응답을 생성하기 전에 Zilliz Cloud에서 가장 관련성 높은 문서 청크를 검색하여, 답변이 모델의 사전 지식이 아니라 사용자의 콘텐츠에 연결되도록 합니다.
- 운영 오버헤드 없이 검색 확장. Zilliz Cloud는 인덱싱, 복제, 대규모 서빙을 처리합니다. 두 개의 환경 변수로 연결하고 자체 벡터 데이터베이스 클러스터 운영을 건너뛸 수 있습니다.
- 벡터 스토어 전환을 위한 최소 구성. DocsGPT를 Milvus에 연결하려면
docker-compose.yaml에서 세 개의 환경 변수만 변경하면 됩니다 — 수정할 애플리케이션 코드는 없습니다. - 관리형 및 셀프 호스팅 배포를 모두 지원. 완전 관리형 설정에는 Zilliz Cloud를 사용하거나, 환경에서 필요하다면 DocsGPT를 셀프 호스팅 Milvus 서버에 연결하세요.
- LangChain 기반 검색과 자연스럽게 작동. DocsGPT는 내부적으로 LangChain + Zilliz Cloud integrations에서 사용되는 것과 동일한 커넥터인
langchain-milvus를 사용하므로, 검색 파이프라인은 충분히 검증되었습니다.
통합 작동 방식
DocsGPT는 프로젝트 문서를 수집하고, 이를 청크로 분할한 다음, GPT 모델을 사용하여 각 청크를 벡터 임베딩으로 변환합니다. 사용자가 질문을 하면, DocsGPT는 쿼리를 임베딩하고 벡터 저장소에서 가장 관련성 높은 청크를 검색한 뒤 자연어 답변을 생성합니다. 검색 품질이 답변 품질을 결정합니다 — 벡터 데이터베이스가 의미 있는 규모에서 이를 가능하게 합니다.
Milvus의 완전 관리형 버전인 Zilliz Cloud는 대규모로 임베딩을 저장, 인덱싱, 검색하기 위한 벡터 데이터베이스 계층을 제공합니다. DocsGPT는 환경 변수로 전달되는 URI와 API 토큰을 통해 여기에 연결되므로, 동일한 Docker Compose 설정을 로컬 개발과 프로덕션에 사용할 수 있습니다. 공식 문서에서 Milvus가 벡터 검색을 처리하는 방식에 대해 자세히 알아볼 수 있습니다.
DocsGPT와 Zilliz Cloud를 함께 사용하면 기존 콘텐츠를 기반으로 문서 Q&A 시스템을 간단하게 구축할 수 있습니다. 이 조합은 개발자가 대규모 문서 세트를 대상으로 질문에 정확하게 답할 수 있는 AI 애플리케이션을 구축하고, 벡터 인프라를 관리하지 않고도 검색을 확장하며, 근거 없는 답변을 생성하는 대신 응답이 원본 자료에 기반하도록 유지하는 데 도움이 됩니다.
단계별 가이드
1. 저장소 클론하기
먼저 DocsGPT 저장소를 로컬 머신에 클론합니다. 이 프로젝트에는 모든 서비스 오케스트레이션을 처리하는 Docker Compose 설정이 포함되어 있으므로, Git 외에 필요한 유일한 사전 요구 사항은 Docker입니다. 클론한 후에는 추가 명령을 실행하기 전에 프로젝트 디렉터리로 이동하세요. (Milvus)
git clone https://github.com/arc53/DocsGPT.git cd DocsGPT2. Milvus 의존성 추가하기
DocsGPT의 애플리케이션 계층은 Milvus와 통신하기 위해
langchain-milvus를 사용합니다. 이를application폴더 아래의requirements.txt에 추가하면 Docker 이미지가 빌드될 때 설치됩니다. 이 단계를 거치지 않으면 백엔드는 시작 시 벡터 저장소에 연결하지 못합니다. (Milvus)echo "\nlangchain-milvus==0.1.6" >> ./application/requirements.txt3. 환경 변수 구성하기
DocsGPT는 시작 시 환경 변수에서 벡터 저장소 구성을 읽습니다.
backend와worker서비스 모두 동일한 세 가지 변수가 필요합니다. worker는 백그라운드 임베딩 작업을 독립적으로 처리하므로 자체 연결 정보가 필요합니다.docker-compose.yaml을 열고 두 서비스 정의 모두에 다음을 추가하세요. (Milvus)backend: build: ./application environment: - VECTOR_STORE=milvus - MILVUS_URI=... - MILVUS_TOKEN=...worker: build: ./application command: celery -A application.app.celery worker -l INFO -B environment: - VECTOR_STORE=milvus - MILVUS_URI=... - MILVUS_TOKEN=...MILVUS_URI와MILVUS_TOKEN에는 두 가지 옵션이 있습니다.- Zilliz Cloud(권장): cloud.zilliz.com에서 무료 계정을 등록하세요. 클러스터를 생성한 후 클러스터 상세 페이지에서
MILVUS_URI(Public Endpoint)와MILVUS_TOKEN(API key)을 확인할 수 있습니다. - 자체 호스팅 Milvus: Milvus 서버를 실행하려면 공식 Milvus 설치 가이드를 따르세요.
MILVUS_URI는http://<your_server_ip>:19530형식이고MILVUS_TOKEN은<your_username>:<your_password>형식입니다.
4. 서비스 시작하기
구성이 완료되면 설정 스크립트를 실행하여 이미지를 빌드하고 모든 서비스를 시작합니다. 첫 실행 시 Docker가 이미지를 가져오고 빌드하는 동안 몇 분 정도 걸립니다. 실행되면 로컬 UI로 이동하여 문서를 업로드하고 질문을 시작하세요. (Milvus)
./setup.sh브라우저에서
http://localhost:5173/을 여세요. 프로젝트 문서를 업로드하고 UI를 통해 직접 쿼리할 수 있습니다.실행 중인 모든 서비스를 중지하려면:
docker compose down- Zilliz Cloud(권장): cloud.zilliz.com에서 무료 계정을 등록하세요. 클러스터를 생성한 후 클러스터 상세 페이지에서
자세히 알아보기


