Der Leitfaden zu bge-base-de-v1.5

Alle Modelle
BAAI / bge-base-en-v1.5

BAAI / bge-base-en-v1.5

AI Model Milvus Integrated

Aufgabe: Einbettung

Modalität: Text

Ähnlichkeitsmetrik: Beliebig (normalisiert)

Lizenz: Apache 2.0

Dimensionen: 768

Maximale Eingabe-Tokens: 512

Preis: Kostenlos

Einführung in bge-base-de-v1.5

bge-base-de-v1.5" ist ein allgemeines BAAI-Einbettungsmodell (BGE), das einen beliebigen englischen Text in einen kompakten Vektor umwandelt.

Vergleichen Sie bge-base-de-v1.5 mit anderen populären BGE-Modellen:

Modell	Dimensionen	Max Tokens	MTEB avg
bge-large-de-v1.5	1024	512	64.23
bge-large-de	1024	512	63.98
bge-base-de-v1.5	768	512	63.55
bge-base-de	768	512	63.36
bge-small-de-v1.5	384	512	62.17
bge-small-de	384	512	62.11

So erstellen Sie Einbettungen mit bge-base-de-v1.5

Es gibt zwei primäre Möglichkeiten, Vektoreinbettungen zu erstellen:

PyMilvus: das Python-SDK für Milvus, das die "bge-base-de-v1.5" nahtlos integriert.
FlagEmbedding: das offizielle Python-SDK, das vom BAAI angeboten wird.

Mit diesen Methoden können Entwickler auf einfache Weise fortgeschrittene Texteinbettungsfunktionen in ihre Anwendungen einbauen.

Sobald die Vektoreinbettungen generiert sind, können sie in der Zilliz Cloud (ein vollständig verwalteter Vektordatenbankdienst, der von Milvus betrieben wird) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Dies sind die vier wichtigsten Schritte:

Registrieren Sie sich für ein kostenloses Zilliz Cloud-Konto.
Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint and API Key.
Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektoreinbettungen ein.
Lassen Sie eine semantische Suche auf den gespeicherten Einbettungen laufen.

Vektoreinbettungen über PyMilvus generieren und in die Zilliz Cloud für die semantische Suche einfügen.

von pymilvus importieren Modell, MilvusClient

ef = model.dense.SentenceTransformerEmbeddingFunction(
   model_name="BAAI/bge-base-de-v1.5",
   device="cpu",
   query_instruction="Stellen Sie diesen Satz für die Suche nach relevanten Passagen dar:"
   )

# Einbettungen für Dokumente generieren
docs = [
   "Künstliche Intelligenz wurde 1956 als akademische Disziplin gegründet.",
   "Alan Turing war die erste Person, die substantielle Forschung im Bereich der KI betrieb.",
   "Turing wurde in Maida Vale, London, geboren und wuchs in Südengland auf."
]

docs_embeddings = ef.encode_documents(docs)

# Einbettungen für Abfragen generieren
queries = ["Wann wurde die künstliche Intelligenz erfunden",
          "Wo wurde Alan Turing geboren?"]

query_embeddings = ef.encode_queries(queries)

# Verbindung zur Zilliz-Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=ef.dim,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
results = client.search(
    collection_name=COLLECTION,
    data=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Weitere Informationen finden Sie in unserer PyMilvus Embedding Model Dokumentation.

Generieren Sie Vektoreinbettungen mit der Python-Bibliothek FlagEmbedding und fügen Sie sie in die Zilliz-Cloud für die semantische Suche ein.

von FlagEmbedding importieren FlagModel
von pymilvus importieren MilvusClient

model = FlagModel("BAAI/bge-base-de-v1.5",
                  query_instruction_for_retrieval="Stellen Sie diesen Satz für die Suche nach relevanten Passagen dar:",
                  use_fp16=False)

# Einbettungen für Dokumente generieren
docs = [
   "Künstliche Intelligenz wurde 1958 als akademische Disziplin gegründet.",
   "Alan Turing war die erste Person, die umfangreiche Forschungen im Bereich der KI durchführte.",
   "Geboren in Maida Vale, London, wuchs Turing in Südengland auf."
]
docs_embeddings = model.encode(docs)

# Einbettungen für Abfragen generieren
queries = ["Wann wurde die künstliche Intelligenz begründet",
          "Wo wurde Alan Turing geboren?"]
query_embeddings = model.encode_queries(queries)

# Verbindung zur Zilliz-Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=768,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})

results = client.search(
    collection_name=COLLECTION,
    data=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Weitere Informationen finden Sie auf der Modellseite zu HuggingFace.

Inhalte

Nahtlose KI-Workflows

Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.

Zilliz Cloud kostenlos ausprobieren

Schätzen Sie schnell Ihre Embedding-Kosten

Einführung in bge-base-de-v1.5

So erstellen Sie Einbettungen mit bge-base-de-v1.5

Vektoreinbettungen über PyMilvus generieren und in die Zilliz Cloud für die semantische Suche einfügen.

Generieren Sie Vektoreinbettungen mit der Python-Bibliothek FlagEmbedding und fügen Sie sie in die Zilliz-Cloud für die semantische Suche ein.

Inhalte

Nahtlose KI-Workflows

Verwandte Ressourcen

Evaluierung Ihres Einbettungsmodells

Trainieren Sie Ihr eigenes Texteinbettungsmodell

Erstellen von AI-Anwendungen mit Retrieval Augmented Generation (RAG)