Alibaba / Qwen3-Embedding-8B
Milvus Integrated
Aufgabe: Einbettung
Modalität: Text
Ähnlichkeitsmetrik: Kosinus
Lizenz: Apache 2.0
Dimensionen: 4096
Maximale Eingabe-Tokens: 32000
Preis: Kostenlos
Einführung in Qwen3-Embedding-8B
Das Qwen3-Embedding-8B-Modell ist Alibabas Text-Embedding-Modell mit 8 Milliarden Parametern innerhalb der Qwen3-Embedding-Serie. Es basiert auf der dichten Qwen3-Architektur, unterstützt eine Kontextlänge von 32k und bietet starke mehrsprachige Fähigkeiten in über 100 menschlichen und Programmiersprachen, wodurch eine effektive Leistung bei Text-Retrieval, Code-Suche und sprachübergreifenden Szenarien ermöglicht wird.
Qwen3-Embedding-8B liefert eine State-of-the-Art-Leistung in Text-Embedding-Anwendungen und belegt derzeit Platz 1 im mehrsprachigen MTEB-Leaderboard (5. Juni 2025) mit einem Score von 70,58. Es bietet außerdem Flexibilität durch Vektordefinitionen über alle Dimensionen hinweg und benutzerdefinierte Anweisungen, sodass Entwickler das Modell an spezifische Aufgaben, Sprachen oder Anwendungsanforderungen anpassen können.
So erstellen Sie Embeddings mit Qwen3-Embedding-8B
Es gibt zwei primäre Möglichkeiten, Vektor-Embeddings zu generieren:
- PyMilvus: das Python-SDK für Milvus, das das Modell
Qwen3-Embedding-8Bnahtlos integriert. - PAI-EAS: Ein verwalteter Dienst zum Bereitstellen benutzerdefinierter Modelle wie
Qwen3-Embedding-8B(für erweiterte Anpassungen).
Sobald die Vektor-Embeddings generiert wurden, können sie in Zilliz Cloud (einem vollständig verwalteten Vektordatenbankdienst, der auf Milvus basiert) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Hier sind vier wichtige Schritte:
- Registrieren Sie sich kostenlos für ein Zilliz-Cloud-Konto.
- Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint und API Key.
- Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektor-Embeddings ein.
- Führen Sie eine semantische Suche auf den gespeicherten Embeddings aus.
Embeddings über PyMilvus erstellen und für die semantische Suche in Zilliz Cloud einfügen
from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient
# Load the Qwen3-Embedding-8B model
ef = SentenceTransformerEmbeddingFunction(
"Qwen/Qwen3-Embedding-8B", trust_remote_code=True
)
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
# Generate embeddings for documents
docs_embeddings = ef(docs)
queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)
# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)
COLLECTION = "qwen3_embedding_8b_documents"
# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)
# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
# Search for similar documents
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
# consistency_level="Strong", # Strong consistency ensures accurate results but may increase latency
output_fields=["text"],
limit=2,
)
# Print search results
for i, query in enumerate(queries):
print(f"\nQuery: {query}")
for result in results[i]:
print(f" - {result['entity']['text']} (distance: {result['distance']:.4f})")
Weitere Informationen finden Sie in unserer PyMilvus Embedding Model-Dokumentation.
Nahtlose KI-Workflows
Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.
Zilliz Cloud kostenlos ausprobieren




