Cohere / embed-multilingual-v3.0
Milvus Integrated
Aufgabe: Einbettung
Modalität: Text
Ähnlichkeitsmetrik: Beliebig (normalisiert)
Lizenz: Proprietär
Dimensionen: 1024
Maximale Eingabe-Tokens: 512
Preis: $0.10 / 1M Token
Einführung in embed-multilingual-v3.0
embed-multilingual-v3.0 ist ein hochleistungsfähiges Einbettungsmodell, das auf mehrsprachige Texte zugeschnitten ist, und ist ein Mitglied von Cohere's neu veröffentlichter Embed V3 Modellfamilie. Es unterstützt mehr als 100 Sprachen und kann für die Suche innerhalb einer Sprache (z. B. Suche mit einer französischen Abfrage in französischen Dokumenten) und für die sprachenübergreifende Suche (z. B. Suche mit einer chinesischen Abfrage in finnischen Dokumenten) verwendet werden. Sie ist ideal für die mehrsprachige [semantische Suche] (https://zilliz.com/glossary/semantic-search), [retrieval augmented generation] (https://zilliz.com/learn/Retrieval-Augmented-Generation) (RAG), Textklassifizierung und Dokumentenclusterung.
Vergleich aller Einbettungsmodelle innerhalb der Embed V3 Modellreihe.
| Modellname | Abmessungen | MTEB Leistung (höher ist besser) | BEIR Leistung (höher ist besser) |
| embed-english-v3.0 | 1024 | 64.5 | 55.9 |
| embed-english-light-3.0 | 384 | 62.0 | 52.0 |
| embed-multilingual-v3.0 | 1024 | 64.0 | 54.6 |
| embed-multilingual-light-v3.0 | 384 | 60.1 | 50.9 |
| einbetten-mehrsprachig-v2.0 | 768 | 58.5 | 47.1 |
- MTEB: Breiter Datensatz für die Bewertung von Abfragen, Klassifizierung und Clustering (56 Datensätze).
- BEIR: Datensatz mit Schwerpunkt auf Out-of-Domain Retrievals (14 Datensätze)
So erstellen Sie Vektoreinbettungen mit embed-multilingual-v3.0
Es gibt zwei primäre Möglichkeiten, Vektoreinbettungen zu erstellen:
- PyMilvus: das Python-SDK für Milvus, das das Modell
embed-multilingual-v3.0nahtlos integriert. - Cohere python SDK: das von Cohere angebotene Python SDK.
Sobald die Vektoreinbettungen generiert sind, können sie in der Zilliz Cloud (ein vollständig verwalteter Vektordatenbankdienst, der von Milvus betrieben wird) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Dies sind die vier wichtigsten Schritte:
- Anmelden für ein kostenloses Zilliz Cloud-Konto.
- Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint and API Key.
- Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektoreinbettungen ein.
- Lassen Sie eine semantische Suche auf den gespeicherten Einbettungen laufen.
Vektoreinbettungen über PyMilvus generieren und in die Zilliz Cloud für die semantische Suche einfügen.
from pymilvus.model.dense import CohereEmbeddingFunction
COHERE_API_KEY = "ihr-cohere-api-schlüssel"
ef = CohereEmbeddingFunction("embed-multilingual-v3.0", api_key=COHERE_API_KEY)
docs = [
"Künstliche Intelligenz wurde 1956 als akademische Disziplin gegründet.",
"Alan Turing war die erste Person, die umfangreiche Forschungen im Bereich der KI durchführte",
"Geboren in Maida Vale, London, wuchs Turing in Südengland auf."
]
# Einbettungen für Dokumente generieren
docs_embeddings = ef.encode_documents(docs)
queries = ["Wann wurde die künstliche Intelligenz erfunden",
"Wo wurde Alan Turing geboren?"]
# Einbettungen für Abfragen generieren
query_embeddings = ef.encode_queries(queries)
# Verbindung zur Zilliz-Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
client.create_collection(
collection_name=COLLECTION,
dimension=ef.dim,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
consistency_level="Strong",
output_fields=["text"])
Weitere Informationen finden Sie in unserer PyMilvus Embedding Model Dokumentation.
Generieren Sie Vektoreinbettungen über das Cohere Python SDK und fügen Sie sie in die Zilliz Cloud für die semantische Suche ein.
importiere Cohere
von pymilvus importieren MilvusClient
COHERE_API_KEY = "ihr-cohere-api-schlüssel"
co = cohere.Client(COHERE_API_KEY)
docs = [
"Künstliche Intelligenz wurde 1956 als akademische Disziplin gegründet.",
"Alan Turing war die erste Person, die substantielle Forschungen im Bereich der KI durchführte",
"Geboren in Maida Vale, London, wuchs Turing in Südengland auf."
]
docs_embeddings = co.embed(
texts=docs, model="embed-multilingual-v3.0", input_type="search_document"
).embeddings
queries = ["Wann wurde die künstliche Intelligenz begründet",
"Wo wurde Alan Turing geboren?"]
query_embeddings = co.embed(
texts=docs, model="embed-english-v3.0", input_type="search_query"
).embeddings
# Verbindung zur Zilliz Cloud mit öffentlichem Endpunkt und API-Schlüssel
client = MilvusClient(
uri=ZILLIZ_PUBLIC_ENDPOINT,
token=ZILLIZ_API_KEY)
COLLECTION = "Dokumente"
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
client.create_collection(
collection_name=COLLECTION,
dimension=1024,
auto_id=True)
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
consistency_level="Strong",
output_fields=["text"])
Weitere Informationen finden Sie in der Cohere-Dokumentation.
- Einführung in embed-multilingual-v3.0
- So erstellen Sie Vektoreinbettungen mit embed-multilingual-v3.0
Inhalte
Nahtlose KI-Workflows
Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.
Zilliz Cloud kostenlos ausprobieren

