항해 대형-2 가이드

모든 모델
Voyage AI / voyage-large-2

Voyage AI / voyage-large-2

AI Model Milvus Integrated

작업: 임베딩

형태: 텍스트

유사성 측정법: 모두(정규화)

라이선스: 독점

차원: 1536

최대 입력 토큰: 16000

가격: 0.12/1M 토큰

보야지 라지-2 모델 소개

'voyage-large-2'는 검색 품질(예: OpenAI V3 Large보다 우수)에 최적화된 Voyage AI의 범용 텍스트 임베딩 모델입니다. 또한 요약, 클러스터링, 분류와 같은 작업에 이상적입니다.

Voyage AI의 다른 인기 임베딩 모델과 voyage-large-2 비교:


모델	컨텍스트 길이(토큰)	임베딩 차원	설명
항해-대형-2-인스트럭트	16000	1024	MTEB 리더보드 상단. 클러스터링, 분류, 검색에 최적화된 인스트럭션 튜닝된 범용 임베딩 모델입니다.
voyage-multilingual-2	32000	1024	다국어 검색 및 RAG에 최적화됨.
voyage-code-2	16000	1536	코드 검색에 최적화됨(대안보다 17% 더 좋음).
voyage-large-2	16000	1536	검색 품질에 최적화된 범용 임베딩 모델(예: OpenAI V3 Large보다 우수).
voyage-2	4000	1024	비용, 지연 시간, 검색 품질 간의 균형을 위해 최적화된 범용 임베딩 모델입니다.

voyage-large-2로 벡터 임베딩을 생성하는 방법

PyMilvus: voyage-large-2 모델을 원활하게 통합하는 Milvus용 Python SDK.
Voyage AI Python 패키지: Voyage AI에서 제공하는 Python SDK.

벡터 임베딩이 생성되면, 질리즈 클라우드(Milvus가 제공하는 완전 관리형 벡터 데이터베이스 서비스)에 저장하여 의미적 유사도 검색에 사용할 수 있습니다. 다음은 네 가지 주요 단계입니다:

질리즈 클라우드 계정을 무료로 가입합니다.
서버리스 클러스터 설정](https://docs.zilliz.com/docs/create-cluster#set-up-a-free-cluster)을 완료하고 퍼블릭 엔드포인트 및 API 키를 발급받습니다.
벡터 컬렉션을 생성하고 벡터 임베딩을 삽입합니다.
저장된 임베딩에 대해 시맨틱 검색을 실행합니다.

파이밀버스를 통해 벡터 임베딩을 생성하고 질리즈 클라우드에 삽입하여 시맨틱 검색을 진행합니다.

파이밀버스 가져오기 모델, MilvusClient에서

ef = model.dense.VoyageEmbeddingFunction(
   model_name="voyage-large-2",
   api_key="your-voyage-api-key",
   )

# 문서에 대한 임베딩 생성
docs = [
   "인공 지능은 1956년에 학문 분야로 설립되었습니다.",
   "앨런 튜링은 인공지능 분야에서 실질적인 연구를 수행한 최초의 인물입니다.",
   "런던의 메이다 베일에서 태어난 튜링은 영국 남부에서 자랐습니다.", "앨런 튜링은 인공지능을 연구한 최초의 사람입니다.".
]

문서_임베딩 = ef.encode_documents(docs)

# 쿼리에 대한 임베딩 생성하기
queries = ["인공 지능은 언제 설립되었나요",
          "앨런 튜링은 어디에서 태어났나요?"]

쿼리 임베딩 = ef.encode_queries(쿼리)

# 퍼블릭 엔드포인트와 API 키로 질리즈 클라우드에 연결하기
client = 밀버스클라이언트(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

컬렉션 = "문서"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=ef.dim,
    auto_id=True)

문서의 경우 zip(docs, docs_embeddings)에 임베딩합니다:
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
results = client.search(
    collection_name=COLLECTION,
    data = 쿼리_임베딩,
    일관성_레벨="강함",
    output_fields=["text"])

자세한 내용은 파이밀버스 임베딩 모델 문서를 참조하세요.

Voyage AI Python 패키지로 벡터 임베딩을 생성하고 시맨틱 검색을 위해 질리즈 클라우드에 삽입하기

import voyageai
pymilvus에서 밀버스 클라이언트 가져 오기

vo = voyageai.Client(api_key="your-voyage-api-key")

# 문서에 대한 임베딩 생성
docs = [
   "인공 지능은 1956년에 학문 분야로 설립되었습니다.",
   "앨런 튜링은 인공지능 분야에서 실질적인 연구를 수행한 최초의 인물입니다.",
   "런던의 메이다 베일에서 태어난 튜링은 영국 남부에서 자랐습니다.", "앨런 튜링은 인공지능을 연구한 최초의 사람입니다.".
]
doc_embedings = vo.embed(docs, model="voyage-large-2", input_type="document").embedings

# 쿼리에 대한 임베딩 생성하기
queries = ["인공 지능은 언제 설립되었나요",
          "앨런 튜링은 어디에서 태어났나요?"]
쿼리_임베딩 = vo.embed(docs, model="voyage-large-2", input_type="query").embedings

# 퍼블릭 엔드포인트와 API 키로 질리즈 클라우드에 연결하기
client = 밀버스클라이언트(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

컬렉션 = "문서"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=1536,
    auto_id=True)

문서의 경우 zip(docs, docs_embeddings)에 임베딩합니다:
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
results = client.search(
    collection_name=COLLECTION,
    data = 쿼리_임베딩,
    일관성_레벨="강함",
    output_fields=["text"])