Die Anleitung zu embed-english-light-v3.0

Alle Modelle
Cohere / embed-english-light-v3.0

Cohere / embed-english-light-v3.0

AI Model Milvus Integrated

Aufgabe: Einbettung

Modalität: Text

Ähnlichkeitsmetrik: Beliebig (normalisiert)

Lizenz: Proprietär

Dimensionen: 384

Maximale Eingabe-Tokens: 512

Preis: $0.10 / 1M Token

Einführung in embed-english-light-v3.0

embed-english-light-v3.0 ist eine kleinere und schnellere Version von embed-english-v3.0. Fast genauso leistungsfähig, aber viel schneller. Maßgeschneidert für englischen Text.

Vergleich aller Einbettungsmodelle der Embed-V3-Modellreihe.

Modellname	Abmessungen	MTEB Leistung (höher ist besser)	BEIR Leistung (höher ist besser)
embed-english-v3.0	1024	64.5	55.9
embed-english-light-3.0	384	62.0	52.0
embed-multilingual-v3.0	1024	64.0	54.6
embed-multilingual-light-v3.0	384	60.1	50.9
embed-multilingual-v2.0	768	58.5	47.1

MTEB: Breiter Datensatz zur Evaluierung von Retrievals, Klassifizierung und Clustering (56 Datensätze)
BEIR: Datensatz mit Schwerpunkt auf Out-of-Domain Retrievals (14 Datensätze)

Erstellen von Vektoreinbettungen mit embed-english-light-v3.0

Es gibt zwei primäre Möglichkeiten, Vektoreinbettungen zu erzeugen:

PyMilvus: das Python-SDK für Milvus, das das Modell "embed-english-light-v3.0" nahtlos integriert.
Cohere Python SDK: das von Cohere angebotene Python SDK.

Sobald die Vektoreinbettungen generiert sind, können sie in der Zilliz Cloud (ein vollständig verwalteter Vektordatenbankdienst, der von Milvus betrieben wird) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Dies sind die vier wichtigsten Schritte:

Anmelden für ein kostenloses Zilliz Cloud-Konto.
Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint and API Key.
Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektoreinbettungen ein.
Lassen Sie eine semantische Suche auf den gespeicherten Einbettungen laufen.

Vektoreinbettungen über PyMilvus generieren und in die Zilliz Cloud für die Ähnlichkeitssuche einfügen.

from pymilvus.model.dense import CohereEmbeddingFunction
von pymilvus importieren MilvusClient

COHERE_API_KEY = "ihr-cohere-api-schlüssel"

ef = CohereEmbeddingFunction("embed-english-light-v3.0", api_key=COHERE_API_KEY)

docs = [
   "Künstliche Intelligenz wurde 1956 als akademische Disziplin gegründet.",
   "Alan Turing war die erste Person, die substantielle Forschungen im Bereich der KI durchführte.",
   "Geboren in Maida Vale, London, wuchs Turing in Südengland auf."
]
# Einbettungen für Dokumente generieren
docs_embeddings = ef.encode_documents(docs)

queries = ["Wann wurde die künstliche Intelligenz begründet",
          "Wo wurde Alan Turing geboren?"]
# Einbettungen für Abfragen generieren
query_embeddings = ef.encode_queries(queries)

# Verbindung zur Zilliz-Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=ef.dim,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
results = client.search(collection_name=COLLECTION,
    data=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Eine Schritt-für-Schritt-Anleitung finden Sie in unserer [PyMilvus Embedding Model Dokumentation] (https://milvus.io/docs/embeddings.md).

Vektoreinbettungen über das Python-SDK von Cohere generieren und in die Zilliz-Cloud für die Ähnlichkeitssuche einfügen

importiere Cohere
von pymilvus importieren MilvusClient

COHERE_API_KEY = "ihr-cohere-api-schlüssel"
co = cohere.Client(COHERE_API_KEY)

docs = [
   "Künstliche Intelligenz wurde 1956 als akademische Disziplin gegründet.",
   "Alan Turing war die erste Person, die substantielle Forschungen im Bereich der KI durchführte.",
   "Geboren in Maida Vale, London, wuchs Turing in Südengland auf."
]

docs_embeddings = co.embed(
    texts=docs, model="embed-english-light-v3.0", input_type="search_document"
).embeddings

queries = ["Wann wurde die künstliche Intelligenz begründet",
          "Wo wurde Alan Turing geboren?"]

query_embeddings = co.embed(
    texts=docs, model="embed-english-light-v3.0", input_type="search_query"
).embeddings

# Verbindung zur Zilliz Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
    uri=ZILLIZ_PUBLIC_ENDPOINT,
    token=ZILLIZ_API_KEY)

COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)
client.create_collection(
    collection_name=COLLECTION,
    dimension=384,
    auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})
    
results = client.search(
    collection_name=COLLECTION,
    data=query_embeddings,
    consistency_level="Strong",
    output_fields=["text"])

Weitere Informationen finden Sie in der Cohere-Dokumentation.

Inhalte

Nahtlose KI-Workflows

Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.

Zilliz Cloud kostenlos ausprobieren

Schätzen Sie schnell Ihre Embedding-Kosten