Cohere / embed-english-light-v3.0
Milvus Integrated
Tarea: Inserción
Modalidad: Texto
Métrica de Similitud: Cualquiera (Normalizado)
Licencia: Propietario
Dimensiones: 384
Tokens de Entrada Máximos: 512
Precio: 0,10 $ / 1 millón de fichas
Introducción a embed-english-light-v3.0
embed-english-light-v3.0 es una versión más pequeña y rápida de embed-english-v3.0. Casi tan capaz, pero mucho más rápida. Adaptado para texto en inglés.
Comparación de todos los modelos de incrustación de la serie de modelos Embed V3.
| Nombre del modelo | Dimensiones | Rendimiento MTEB (cuanto más alto mejor) | Rendimiento BEIR (cuanto más alto mejor) | |
|---|---|---|---|---|
| embed-english-v3.0 | 1024 | 64.5 | 55.9 | |
| embed-english-light-3.0 384 62.0 52.0 | ||||
| embed-multilingual-v3.0](https://zilliz.com/ai-models/embed-multilingual-v3.0) | 1024 | 64.0 | 54.6 | embed-multilingual-light-3.0 |
| embed-multilingual-light-v3.0 384 60.1 50.9 | ||||
| embed-multilingual-v2.0 768 58.5 47.1 |
- MTEB: Amplio conjunto de datos para evaluar recuperaciones, clasificación y agrupación (56 conjuntos de datos).
- BEIR: conjunto de datos centrado en recuperaciones fuera del dominio (14 conjuntos de datos)
Cómo crear incrustaciones vectoriales con embed-english-light-v3.0
Hay dos formas principales de generar incrustaciones vectoriales:
- Cohere Python SDK: el SDK de python ofrecido por Cohere.
Una vez generadas las incrustaciones vectoriales, pueden almacenarse en Zilliz Cloud (un servicio de base de datos vectorial totalmente gestionado e impulsado por Milvus) y utilizarse para la búsqueda de similitud semántica. He aquí cuatro pasos clave:
- Inscríbete para obtener una cuenta de Zilliz Cloud de forma gratuita.
- Configura un clúster sin servidor y obtén el Public Endpoint and API Key.
- Crea una colección de vectores e inserta tus incrustaciones vectoriales.
- Ejecuta una búsqueda semántica en las incrustaciones almacenadas.
Generar incrustaciones vectoriales a través de PyMilvus e insertarlas en Zilliz Cloud para la búsqueda de similitud.
from pymilvus.model.dense import CohereEmbeddingFunction
from pymilvus import MilvusClient
COHERE_API_KEY = "su-cohere-api-key"
ef = CohereEmbeddingFunction("embed-english-light-v3.0", api_key=COHERE_API_KEY)
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1956",
"Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
# Generar incrustaciones para documentos
docs_embeddings = ef.encode_documents(docs)
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
# Generar incrustaciones para las consultas
query_embeddings = ef.encode_queries(queries)
# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=ef.dim,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
results = client.search(nombre_coleccion=COLECCION,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["texto"])
Consulte nuestra Documentación sobre el modelo de incrustación de PyMilvus para obtener una guía paso a paso.
Generar incrustaciones vectoriales mediante Cohere python SDK e insertarlas en Zilliz Cloud para la búsqueda de similitudes.
importar cohere
from pymilvus import MilvusClient
COHERE_API_KEY = "su-cohere-api-key"
co = cohere.Cliente(COHERE_API_KEY)
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1956",
"Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
docs_embeddings = co.embed(
texts=docs, model="embed-english-light-v3.0", input_type="search_document"
).embeddings
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
query_embeddings = co.embed(
texts=docs, model="embed-english-light-v3.0", input_type="search_query"
).embeddings
# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=384,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
resultados = client.search(
nombre_colección=COLECCIÓN,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["text"])
Para más información, consulte Cohere documentation.
- Introducción a embed-english-light-v3.0
- Cómo crear incrustaciones vectoriales con embed-english-light-v3.0
Contenido
Flujos de trabajo de IA sin interrupciones
Desde incrustaciones hasta búsqueda de IA escalable—Zilliz Cloud te permite almacenar, indexar y recuperar incrustaciones con una velocidad y eficiencia inigualables.
Prueba Zilliz Cloud Gratis

