BAAI / bge-base-en-v1.5
Milvus Integrated
Tarea: Inserción
Modalidad: Texto
Métrica de Similitud: Cualquiera (Normalizado)
Licencia: Apache 2.0
Dimensiones: 768
Tokens de Entrada Máximos: 512
Precio: Gratis
Introducción a bge-base-es-v1.5
bge-base-es-v1.5 es un modelo de incrustación general BAAI (BGE) que transforma cualquier texto en inglés en un vector compacto.
Compare bge-base-en-v1.5 con otros modelos BGE populares:
| Modelo | Dimensiones | Max Tokens | MTEB avg |
|---|---|---|---|
| bge-large-es-v1.5 1024 512 64.23 | |||
| bge-large-es 1024 512 63.98 | |||
| bge-base-es-v1.5 768 512 63.55 | |||
| bge-base-es 768 512 63.36 | |||
| bge-small-es-v1.5 384 512 62.17 | |||
| bge-small-es 384 512 62.11 |
Cómo crear incrustaciones con bge-base-es-v1.5
Hay dos formas principales de crear incrustaciones vectoriales:
- PyMilvus: el SDK de Python para Milvus que integra perfectamente el
bge-base-en-v1.5. - FlagEmbedding: el SDK oficial de Python ofrecido por BAAI.
Estos métodos permiten a los desarrolladores incorporar fácilmente capacidades avanzadas de incrustación de texto en sus aplicaciones.
Una vez generadas las incrustaciones vectoriales, pueden almacenarse en Zilliz Cloud (un servicio de base de datos vectorial totalmente gestionado e impulsado por Milvus) y utilizarse para la búsqueda semántica de similitudes. He aquí cuatro pasos clave:
- Registrarse para obtener una cuenta de Zilliz Cloud de forma gratuita.
- Configura un clúster sin servidor y obtén el Public Endpoint and API Key.
- Crea una colección de vectores e inserta tus incrustaciones vectoriales.
- Ejecuta una búsqueda semántica en las incrustaciones almacenadas.
Generar incrustaciones vectoriales a través de PyMilvus e insertarlas en Zilliz Cloud para la búsqueda semántica.
from pymilvus import model, MilvusClient
ef = model.dense.SentenceTransformerEmbeddingFunction(
model_name="BAAI/bge-base-es-v1.5",
device="cpu",
query_instruction="Representar esta frase para buscar pasajes relevantes:"
)
# Generar incrustaciones para documentos
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1956",
"Alan Turing fue la primera persona en realizar una investigación sustancial en IA.",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
docs_embeddings = ef.encode_documents(docs)
# Generar incrustaciones para consultas
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
query_embeddings = ef.encode_queries(queries)
# Conectar a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=ef.dim,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
resultados = client.search(
nombre_colección=COLECCIÓN,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["text"])
Para más información, consulte nuestra Documentación sobre el modelo de incrustación de PyMilvus.
Generar incrustaciones vectoriales mediante la biblioteca FlagEmbedding Python e insertarlas en Zilliz Cloud para la búsqueda semántica.
from FlagEmbedding import FlagModel
from pymilvus import MilvusClient
model = FlagModel("BAAI/bge-base-es-v1.5",
query_instruction_for_retrieval="Representar esta frase para buscar pasajes relevantes:",
use_fp16=False)
# Generar incrustaciones para documentos
docs = [
"La inteligencia artificial se fundó como disciplina académica en 1958",
"Alan Turing fue la primera persona en llevar a cabo una investigación sustancial en IA",
"Nacido en Maida Vale, Londres, Turing se crió en el sur de Inglaterra."
]
docs_embeddings = model.encode(docs)
# Generar incrustaciones para consultas
queries = ["¿Cuándo se fundó la inteligencia artificial?
"¿Dónde nació Alan Turing?"]
query_embeddings = model.encode_queries(queries)
# Conectarse a Zilliz Cloud con el punto final público y la clave API
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLECCIÓN = "documentos"
if client.has_collection(nombre_coleccion=COLECCION):
client.drop_collection(nombre_coleccion=COLECCION)
client.create_collection(
nombre_colección=COLECCIÓN,
dimensión=768,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"texto": doc, "vector": incrustación})
resultados = client.search(
nombre_colección=COLECCIÓN,
datos=consulta_incrustaciones,
consistency_level="Strong",
output_fields=["text"])
Para más información, consulte la página del modelo sobre HuggingFace.
Flujos de trabajo de IA sin interrupciones
Desde incrustaciones hasta búsqueda de IA escalable—Zilliz Cloud te permite almacenar, indexar y recuperar incrustaciones con una velocidad y eficiencia inigualables.
Prueba Zilliz Cloud Gratis




