La guía del modelo embed-multilingual-v3.0

Todos los modelos
Cohere / embed-multilingual-v3.0

Cohere / embed-multilingual-v3.0

AI Model Milvus Integrated

Tarea: Inserción

Modalidad: Texto

Métrica de Similitud: Cualquiera (Normalizado)

Licencia: Propietario

Dimensiones: 1024

Tokens de Entrada Máximos: 512

Precio: 0,10 $ / 1 millón de fichas

Introducción a embed-multilingual-v3.0

embed-multilingual-v3.0` es un modelo de incrustación de alto rendimiento diseñado para texto multilingüe y es miembro de la familia de modelos Embed V3 de Cohere recientemente lanzada. Es compatible con más de 100 idiomas y se puede utilizar para realizar búsquedas dentro de un mismo idioma (por ejemplo, buscar con una consulta en francés en documentos franceses) y en varios idiomas (por ejemplo, buscar con una consulta en chino en documentos finlandeses). Es ideal para la [búsqueda semántica] multilingüe (https://zilliz.com/glossary/semantic-search), la [generación aumentada de recuperación] (https://zilliz.com/learn/Retrieval-Augmented-Generation) (RAG), la clasificación de textos y la agrupación de documentos.

Comparación de todos los modelos de incrustación dentro de la serie de modelos Embed V3.

Nombre del modelo Dimensiones Rendimiento MTEB (cuanto más alto, mejor)** Rendimiento BEIR (cuanto más alto, mejor) | embed-english-v3.0 1024 64.5 55.9 | embed-english-light-3.0 384 62.0 52.0 | embed-multilingual-v3.0 1024 64.0 54.6 | embed-multilingual-light-v3.0 384 60.1 50.9 | embed-multilingual-v2.0 768 58.5 47.1

MTEB: amplio conjunto de datos para evaluar recuperaciones, clasificación y agrupación (56 conjuntos de datos)
BEIR: conjunto de datos centrado en recuperaciones fuera del dominio (14 conjuntos de datos)

Cómo crear incrustaciones vectoriales con embed-multilingual-v3.0

Hay dos formas principales de crear incrustaciones vectoriales:

PyMilvus: el SDK de Python para Milvus que integra perfectamente el modelo embed-multilingual-v3.0.
Cohere python SDK: el SDK de python ofrecido por Cohere.

Una vez generadas las incrustaciones vectoriales, pueden almacenarse en Zilliz Cloud (un servicio de base de datos vectorial totalmente gestionado e impulsado por Milvus) y utilizarse para la búsqueda de similitud semántica. He aquí cuatro pasos clave:

Inscríbete para obtener una cuenta de Zilliz Cloud de forma gratuita.
Configura un clúster sin servidor y obtén el Public Endpoint and API Key.
Crea una colección de vectores e inserta tus incrustaciones vectoriales.
Ejecuta una búsqueda semántica en las incrustaciones almacenadas.

Generar incrustaciones vectoriales a través de PyMilvus e insertarlas en Zilliz Cloud para la búsqueda semántica.

from pymilvus.model.dense import CohereEmbeddingFunction

COHERE_API_KEY = "tu-cohere-api-clave"
ef = CohereEmbeddingFunction("embed-multilingual-v3.0", api_key=COHERE_API_KEY)

docs = [
   "La inteligencia artificial se fundó como disciplina académica en 1956",
   "Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
   "Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]

# Generar incrustaciones para documentos
docs_embeddings = ef.encode_documents(docs)

queries = ["¿Cuándo se fundó la inteligencia artificial?
          "¿Dónde nació Alan Turing?"]

# Generar incrustaciones para las consultas
incrustaciones_consulta = ef.codificar_consultas(consultas)

# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
    client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
    nombre_colección=COLECCIÓN,
    dimensión=ef.dim,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
    
resultados = client.search(
    nombre_colección=COLECCIÓN,
    datos=consulta_incrustaciones,
    consistency_level="Strong",
    output_fields=["text"])

Para más información, consulte nuestra Documentación sobre el modelo de incrustación de PyMilvus.

Generar incrustaciones vectoriales a través de Cohere Python SDK e insertarlas en Zilliz Cloud para la búsqueda semántica.

importar cohere
from pymilvus import MilvusClient

COHERE_API_KEY = "su-cohere-api-key"
co = cohere.Cliente(COHERE_API_KEY)

docs = [
   "La inteligencia artificial se fundó como disciplina académica en 1956",
   "Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
   "Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]

docs_embeddings = co.embed(
    texts=docs, model="embed-multilingual-v3.0", input_type="search_document"
).incrustaciones

queries = ["¿Cuándo se fundó la inteligencia artificial?
          "¿Dónde nació Alan Turing?"]

incrustaciones_consulta = co.embed(
    texts=docs, model="embed-english-v3.0", input_type="search_query"
).embeddings

# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
    client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
    nombre_colección=COLECCIÓN,
    dimensión=1024,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
    
resultados = client.search(
    nombre_colección=COLECCIÓN,
    datos=consulta_incrustaciones,
    consistency_level="Strong",
    output_fields=["text"])

Para más información, consulte Cohere documentation.

Contenido

Flujos de trabajo de IA sin interrupciones

Desde incrustaciones hasta búsqueda de IA escalable—Zilliz Cloud te permite almacenar, indexar y recuperar incrustaciones con una velocidad y eficiencia inigualables.

Prueba Zilliz Cloud Gratis

Comparte este artículo

Calcule rápidamente el costo de su incrustación

Introducción a embed-multilingual-v3.0

Cómo crear incrustaciones vectoriales con embed-multilingual-v3.0

Generar incrustaciones vectoriales a través de PyMilvus e insertarlas en Zilliz Cloud para la búsqueda semántica.

Generar incrustaciones vectoriales a través de Cohere Python SDK e insertarlas en Zilliz Cloud para la búsqueda semántica.

Contenido

Flujos de trabajo de IA sin interrupciones

Comparte este artículo

Recursos relacionados

Evaluación del modelo de incrustación

Formación de su propio modelo de incrustación de texto

Cree aplicaciones de IA con la Generación Aumentada por Recuperación (RAG)