ボヤージュAI / voyage-2
Milvus Integrated
タスク: 埋め込み
モダリティ: テキスト
類似性メトリック: 任意(正規化)
ライセンス: 専有
次元: 1024
最大入力トークン: 4000
価格: 0.1/100万トークン
#ボヤージュ2入門
voyage-2`はVoyage AIの汎用テキスト埋め込みモデルで、コスト、待ち時間、検索品質のバランスを取るために最適化されている。
voyage-2` と Voyage AI の他の一般的な埋め込みモデルとの比較:
モデル | コンテキストの長さ(トークン) | 埋め込みの次元 | 説明 |
voyage-large-2-instruct|16000|1024| MTEB leaderboardのトップ。クラスタリング、分類、検索のために最適化された、命令チューニングされた汎用埋め込みモデル。 | |||
voyage-multilingual-2|32000|1024| 多言語検索とRAGに最適化。 | |||
voyage-code-2](https://zilliz.com/ai-models/voyage-code-2)|16000|1536|コード検索に最適化(代替品より17%改善)。 | |||
voyage-large-2](https://zilliz.com/ai-models/voyage-large-2) | 16000 | 1536 | 検索品質に最適化された汎用埋め込みモデル(例えばOpenAI V3 Largeよりも優れている)。 |
voyage-2|4000|1024| コスト、レイテンシ、検索品質のバランスに最適化された汎用エンベッディングモデル。 |
voyage-2 によるテキスト埋め込み作成方法
ベクトル埋め込みを作成するには、主に2つの方法があります:
1.1.PyMilvus:MilvusのPython SDKで、voyage-2
モデルをシームレスに統合しています。
2.Voyage AI Embedding: Voyage AIが提供するPython SDK。
ベクトル埋め込みが生成されると、Zilliz Cloud (Milvusによって提供されるフルマネージドベクトルデータベースサービス)に保存され、意味的類似性検索に使用することができる。以下は、4つの重要なステップである:
1.1.サインアップ Zilliz Cloudアカウントを無料で取得する。 2.サーバーレスクラスターのセットアップ](https://docs.zilliz.com/docs/create-cluster#set-up-a-free-cluster)とパブリックエンドポイントとAPIキーを取得する。 3.ベクター・コレクションを作成し、ベクター埋め込みを挿入します。 4.**セマンティック検索を実行する。
PyMilvusで埋め込みベクトルを生成し、Zilliz Cloudに挿入してセマンティック検索を行う。
from pymilvus import model, MilvusClient
ef = model.dense.VoyageEmbeddingFunction(
model_name="voyage-2"、
api_key="your-voyage-api-key"、
)
# ドキュメントの埋め込みを生成する
ドキュメント = [
「人工知能は1956年に学問分野として創設された、
"アラン・チューリングは、AIの実質的な研究を行った最初の人物である。"、
"チューリングはロンドンのマイダヴェールで生まれ、イングランド南部で育った。"
]
docs_embeddings = ef.encode_documents(docs)
# クエリの埋め込みを生成する
queries = ["人工知能はいつ誕生したのか?
「アラン・チューリングはどこで生まれたか?]
query_embeddings = ef.encode_queries(queries)
# Public EndpointとAPI KeyでZilliz Cloudに接続する
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT、
token=ZILLIZ_API_KEY)
COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
client.create_collection(
コレクション名=COLLECTION、
dimension=ef.dim、
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
results = client.search(
collection_name=COLLECTION、
data=query_embeddings、
consistency_level="Strong"、
output_fields=["text"])
詳細はPyMilvus Embedding Model documentationを参照してください。
Voyage AI の Python SDK を使ってベクトル埋め込みを生成し、Zilliz Cloud に挿入して意味検索を行う。
import voyageai
from pymilvus import MilvusClient
VOYAGE_API_KEY = "あなたの-voyage-api-key"
vo = voyageai.Client(api_key=VOYAGE_API_KEY)
# ドキュメントの埋め込みを生成する
ドキュメント = [
"人工知能は1956年に学問分野として設立された"、
"アラン・チューリングはAIの実質的な研究を行った最初の人物である"、
"チューリングはロンドンのマイダヴェールで生まれ、イングランド南部で育った。"
]
docs_embeddings = vo.embed(docs, model="voyage-2", input_type="document").embeddings
# クエリの埋め込みを生成
queries = ["人工知能はいつ誕生したのか?
「アラン・チューリングはどこで生まれましたか?]
query_embeddings = vo.embed(queries, model="voyage-2", input_type="query").embeddings
# Public EndpointとAPI KeyでZilliz Cloudに接続する
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT、
token=ZILLIZ_API_KEY)
COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
client.create_collection(
collection_name=COLLECTION、
dimension=1024、
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
results = client.search(
collection_name=COLLECTION、
data=query_embeddings、
consistency_level="Strong"、
output_fields=["text"])
詳細はVoyage AI Embedding Guideを参照してください。
シームレス AI ワークフロー
埋め込みからスケーラブルな AI 検索まで、 Zilliz Cloud は、埋め込みを比類のないスピードと効率で保存、インデックス、検索できます。
Zilliz Cloudを無料で試す