Cohere / embed-multilingual-v3.0
Milvus Integrated
Tarea: Inserción
Modalidad: Texto
Métrica de Similitud: Cualquiera (Normalizado)
Licencia: Propietario
Dimensiones: 1024
Tokens de Entrada Máximos: 512
Precio: 0,10 $ / 1 millón de fichas
Introducción a embed-multilingual-v3.0
embed-multilingual-v3.0` es un modelo de incrustación de alto rendimiento diseñado para texto multilingüe y es miembro de la familia de modelos Embed V3 de Cohere recientemente lanzada. Es compatible con más de 100 idiomas y se puede utilizar para realizar búsquedas dentro de un mismo idioma (por ejemplo, buscar con una consulta en francés en documentos franceses) y en varios idiomas (por ejemplo, buscar con una consulta en chino en documentos finlandeses). Es ideal para la [búsqueda semántica] multilingüe (https://zilliz.com/glossary/semantic-search), la [generación aumentada de recuperación] (https://zilliz.com/learn/Retrieval-Augmented-Generation) (RAG), la clasificación de textos y la agrupación de documentos.
Comparación de todos los modelos de incrustación dentro de la serie de modelos Embed V3.
Nombre del modelo Dimensiones Rendimiento MTEB (cuanto más alto, mejor)** Rendimiento BEIR (cuanto más alto, mejor) | embed-english-v3.0 1024 64.5 55.9 | embed-english-light-3.0 384 62.0 52.0 | embed-multilingual-v3.0 1024 64.0 54.6 | embed-multilingual-light-v3.0 384 60.1 50.9 | embed-multilingual-v2.0 768 58.5 47.1
- MTEB: amplio conjunto de datos para evaluar recuperaciones, clasificación y agrupación (56 conjuntos de datos)
- BEIR: conjunto de datos centrado en recuperaciones fuera del dominio (14 conjuntos de datos)
Cómo crear incrustaciones vectoriales con embed-multilingual-v3.0
Hay dos formas principales de crear incrustaciones vectoriales:
- PyMilvus: el SDK de Python para Milvus que integra perfectamente el modelo
embed-multilingual-v3.0. - Cohere python SDK: el SDK de python ofrecido por Cohere.
Una vez generadas las incrustaciones vectoriales, pueden almacenarse en Zilliz Cloud (un servicio de base de datos vectorial totalmente gestionado e impulsado por Milvus) y utilizarse para la búsqueda de similitud semántica. He aquí cuatro pasos clave:
- Inscríbete para obtener una cuenta de Zilliz Cloud de forma gratuita.
- Configura un clúster sin servidor y obtén el Public Endpoint and API Key.
- Crea una colección de vectores e inserta tus incrustaciones vectoriales.
- Ejecuta una búsqueda semántica en las incrustaciones almacenadas.
Generar incrustaciones vectoriales a través de PyMilvus e insertarlas en Zilliz Cloud para la búsqueda semántica.
from pymilvus.model.dense import CohereEmbeddingFunction
COHERE_API_KEY = "tu-cohere-api-clave"
ef = CohereEmbeddingFunction("embed-multilingual-v3.0", api_key=COHERE_API_KEY)
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1956",
"Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
# Generar incrustaciones para documentos
docs_embeddings = ef.encode_documents(docs)
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
# Generar incrustaciones para las consultas
incrustaciones_consulta = ef.codificar_consultas(consultas)
# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=ef.dim,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
resultados = client.search(
nombre_colección=COLECCIÓN,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["text"])
Para más información, consulte nuestra Documentación sobre el modelo de incrustación de PyMilvus.
Generar incrustaciones vectoriales a través de Cohere Python SDK e insertarlas en Zilliz Cloud para la búsqueda semántica.
importar cohere
from pymilvus import MilvusClient
COHERE_API_KEY = "su-cohere-api-key"
co = cohere.Cliente(COHERE_API_KEY)
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1956",
"Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
docs_embeddings = co.embed(
texts=docs, model="embed-multilingual-v3.0", input_type="search_document"
).incrustaciones
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
incrustaciones_consulta = co.embed(
texts=docs, model="embed-english-v3.0", input_type="search_query"
).embeddings
# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=1024,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
resultados = client.search(
nombre_colección=COLECCIÓN,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["text"])
Para más información, consulte Cohere documentation.
- Introducción a embed-multilingual-v3.0
- Cómo crear incrustaciones vectoriales con embed-multilingual-v3.0
Contenido
Flujos de trabajo de IA sin interrupciones
Desde incrustaciones hasta búsqueda de IA escalable—Zilliz Cloud te permite almacenar, indexar y recuperar incrustaciones con una velocidad y eficiencia inigualables.
Prueba Zilliz Cloud Gratis

