La guida al codice voyage-2

Tutti i modelli
Viaggio AI / voyage-code-2

Viaggio AI / voyage-code-2

AI Model Milvus Integrated

Compito: Incorporazione

Modalità: Testo

Metrica di Similarità: Qualsiasi (normalizzato)

Licenza: Proprietario

Dimensioni: 1536

Token di Input Massimi: 16000

Prezzo: $ 0,12/1M di gettoni

Introduzione a voyage-code-2

voyage-code-2" è il modello di incorporazione del testo di Voyage AI ottimizzato per il recupero dei codici (17% migliore delle alternative).

Confronto tra voyage-code-2 e altri modelli di incorporamento popolari di Voyage AI:


Modello	Lunghezza del contesto (token)	Dimensione di incorporamento	Descrizione
voyage-large-2-instruct	16000	1024	In cima alla classifica MTEB. Modello di incorporamento generale ottimizzato per il clustering, la classificazione e il recupero.
voyage-multilingual-2	32000	1024	Ottimizzato per il recupero multilingue e il RAG.
voyage-code-2	16000	1536	Ottimizzato per il recupero di codici (17% migliore delle alternative).
voyage-large-2	16000	1536	Modello di incorporamento generico ottimizzato per la qualità del recupero (ad esempio, migliore di OpenAI V3 Large).
voyage-2	4000	1024	Modello di incorporamento generico ottimizzato per bilanciare costi, latenza e qualità di recupero.

Come creare embeddings con voyage-code-2

Esistono due modi principali per creare le incorporazioni vettoriali:

PyMilvus: l'SDK Python per Milvus che integra perfettamente il modello voyage-code-2.
Voyage AI Embedding: l'SDK Python offerto da Voyage AI.

Una volta generate le incorporazioni vettoriali, queste possono essere archiviate in Zilliz Cloud (un servizio di database vettoriale completamente gestito da Milvus) e utilizzate per la ricerca di similarità semantica. Ecco i quattro passaggi chiave:

Iscriviti per un account Zilliz Cloud gratuito.
Configurare un cluster serverless e ottenere il Public Endpoint and API Key.
Creare una collezione di vettori e inserire gli embeddings vettoriali.
Eseguire una ricerca semantica sugli embeddings memorizzati.

Generare embeddings vettoriali tramite PyMilvus e inserirli in Zilliz Cloud per la ricerca semantica.

da pymilvus import model, MilvusClient

ef = model.dense.VoyageEmbeddingFunction(
   model_name="voyage-code-2",
   api_key="your-voyage-api-key",
   )

# Generare le incorporazioni per i documenti
documenti = [
    "retriever = KNNRetriever.from_texts(documents, embeddings)",
    "knn = KNeighborsClassifier(n_neighbors=3)",
    "sorted_numbers = sorted(numbers)",
    "def dynamic_programming(): print('yes')",
    "documents_embds = get_embeddings(documents)",
    "response = client.embeddings.create(input = documents, model='text-embedding-ada-002')"
]

docs_embeddings = ef.encode_documents(docs)

# Generare embeddings per le query
queries = ["La funzione dynamic_programming() è implementata utilizzando la programmazione dinamica?"]

query_embeddings = ef.encode_queries(queries)

# Connettersi a Zilliz Cloud con l'endpoint pubblico e la chiave API
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLEZIONE = "documenti"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(nome_raccolta=COLLEZIONE)
client.create_collection(
    nome_collezione=COLLEZIONE,
    dimensione=ef.dim,
    auto_id=True)

per doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
risultati = client.search(
    nome_collezione=COLLEZIONE,
    dati=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Per ulteriori informazioni, consultare la nostra [documentazione sul modello di incorporazione di PyMilvus] (https://milvus.io/docs/embeddings.md).

Generare embeddings vettoriali tramite l'SDK Python di Voyage AI e inserirli in Zilliz Cloud per la ricerca semantica.

importare voyageai
da pymilvus import MilvusClient

vo = voyageai.Client(api_key="your-voyage-api-key")

# Generare le incorporazioni per i documenti
documenti = [
    "retriever = KNNRetriever.from_texts(documents, embeddings)",
    "knn = KNeighborsClassifier(n_neighbors=3)",
    "sorted_numbers = sorted(numbers)",
    "def dynamic_programming(): print('yes')",
    "documents_embds = get_embeddings(documents)",
    "response = client.embeddings.create(input = documents, model='text-embedding-ada-002')"
]

docs_embeddings = vo.embed(docs, model="voyage-code-2", input_type="document").embeddings

# Generare embeddings per le query
queries = ["La funzione dynamic_programming() è implementata utilizzando la programmazione dinamica?"]

query_embeddings = vo.embed(queries, model="voyage-code-2", input_type="query").embeddings

# Connettersi a Zilliz Cloud con l'endpoint pubblico e la chiave API
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLEZIONE = "documenti"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(nome_raccolta=COLLEZIONE)
client.create_collection(
    nome_collezione=COLLEZIONE,
    dimensione=1536,
    auto_id=True)

per doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
risultati = client.search(
    nome_collezione=COLLEZIONE,
    dati=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Per ulteriori informazioni, consultare Voyage AI Embedding Guide.

Contenuto

Flussi di lavoro AI senza interruzioni

Dalle embedding alla ricerca AI scalabile—Zilliz Cloud ti consente di memorizzare, indicizzare e recuperare embedding con velocità e efficienza senza pari.

Prova Zilliz Cloud gratuitamente

Condividi questo articolo

Stima rapidamente il costo delle tue embedding

Introduzione a voyage-code-2

Come creare embeddings con voyage-code-2

Generare embeddings vettoriali tramite PyMilvus e inserirli in Zilliz Cloud per la ricerca semantica.

Generare embeddings vettoriali tramite l'SDK Python di Voyage AI e inserirli in Zilliz Cloud per la ricerca semantica.

Contenuto

Flussi di lavoro AI senza interruzioni

Condividi questo articolo

Risorse Correlate

Addestrare il proprio modello di incorporazione del testo

Valutazione del modello di incorporazione

Scegliere il giusto modello di incorporazione per i propri dati