Der Leitfaden zu Qwen3-Embedding-8B

Alle Modelle
Alibaba / Qwen3-Embedding-8B

Alibaba / Qwen3-Embedding-8B

AI Model Milvus Integrated

Aufgabe: Einbettung

Modalität: Text

Ähnlichkeitsmetrik: Kosinus

Lizenz: Apache 2.0

Dimensionen: 4096

Maximale Eingabe-Tokens: 32000

Preis: Kostenlos

Einführung in Qwen3-Embedding-8B

Das Qwen3-Embedding-8B-Modell ist Alibabas Text-Embedding-Modell mit 8 Milliarden Parametern innerhalb der Qwen3-Embedding-Serie. Es basiert auf der dichten Qwen3-Architektur, unterstützt eine Kontextlänge von 32k und bietet starke mehrsprachige Fähigkeiten in über 100 menschlichen und Programmiersprachen, wodurch eine effektive Leistung bei Text-Retrieval, Code-Suche und sprachübergreifenden Szenarien ermöglicht wird.

Qwen3-Embedding-8B liefert eine State-of-the-Art-Leistung in Text-Embedding-Anwendungen und belegt derzeit Platz 1 im mehrsprachigen MTEB-Leaderboard (5. Juni 2025) mit einem Score von 70,58. Es bietet außerdem Flexibilität durch Vektordefinitionen über alle Dimensionen hinweg und benutzerdefinierte Anweisungen, sodass Entwickler das Modell an spezifische Aufgaben, Sprachen oder Anwendungsanforderungen anpassen können.

So erstellen Sie Embeddings mit Qwen3-Embedding-8B

Es gibt zwei primäre Möglichkeiten, Vektor-Embeddings zu generieren:

PyMilvus: das Python-SDK für Milvus, das das Modell Qwen3-Embedding-8B nahtlos integriert.
PAI-EAS: Ein verwalteter Dienst zum Bereitstellen benutzerdefinierter Modelle wie Qwen3-Embedding-8B (für erweiterte Anpassungen).

Sobald die Vektor-Embeddings generiert wurden, können sie in Zilliz Cloud (einem vollständig verwalteten Vektordatenbankdienst, der auf Milvus basiert) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Hier sind vier wichtige Schritte:

Registrieren Sie sich kostenlos für ein Zilliz-Cloud-Konto.
Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint und API Key.
Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektor-Embeddings ein.
Führen Sie eine semantische Suche auf den gespeicherten Embeddings aus.

Embeddings über PyMilvus erstellen und für die semantische Suche in Zilliz Cloud einfügen

from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient

# Load the Qwen3-Embedding-8B model
ef = SentenceTransformerEmbeddingFunction(
    "Qwen/Qwen3-Embedding-8B", trust_remote_code=True
)

docs = [
    "Artificial intelligence was founded as an academic discipline in 1956.",
    "Alan Turing was the first person to conduct substantial research in AI.",
    "Born in Maida Vale, London, Turing was raised in southern England.",
]

# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]

# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)

COLLECTION = "qwen3_embedding_8b_documents"

# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)

# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)

# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})

# Search for similar documents
results = client.search(
    collection_name=COLLECTION,
    data=query_embeddings,
    # consistency_level="Strong",  # Strong consistency ensures accurate results but may increase latency
    output_fields=["text"],
    limit=2,
)

# Print search results
for i, query in enumerate(queries):
    print(f"\nQuery: {query}")
    for result in results[i]:
        print(f"  - {result['entity']['text']} (distance: {result['distance']:.4f})")

Weitere Informationen finden Sie in unserer PyMilvus Embedding Model-Dokumentation.

Inhalte

Nahtlose KI-Workflows

Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.

Zilliz Cloud kostenlos ausprobieren

Schätzen Sie schnell Ihre Embedding-Kosten

Einführung in Qwen3-Embedding-8B

So erstellen Sie Embeddings mit Qwen3-Embedding-8B

Embeddings über PyMilvus erstellen und für die semantische Suche in Zilliz Cloud einfügen

Inhalte

Nahtlose KI-Workflows

Verwandte Ressourcen

Evaluierung Ihres Einbettungsmodells

Trainieren Sie Ihr eigenes Texteinbettungsmodell

Erstellen von AI-Anwendungen mit Retrieval Augmented Generation (RAG)