Alibaba / Qwen3-Embedding-8B
Milvus Integrated
Задача: Встраивание
Модальность: Текст
Метрика сходства: Косинус
Лицензия: Apache 2.0
Размерности: 4096
Максимальное количество входных токенов: 32000
Цена: Бесплатно
Введение в Qwen3-Embedding-8B
Модель Qwen3-Embedding-8B — это модель текстовых эмбеддингов Alibaba с 8 миллиардами параметров в серии Qwen3 Embedding. Построенная на плотной архитектуре Qwen3, она поддерживает длину контекста 32k и предлагает мощные многоязычные возможности для 100+ человеческих языков и языков программирования, обеспечивая эффективную производительность в поиске текста, поиске по коду и межъязыковых сценариях.
Qwen3-Embedding-8B обеспечивает передовую производительность в приложениях текстовых эмбеддингов и в настоящее время занимает 1-е место в многоязычном рейтинге MTEB (5 июня 2025 г.) с результатом 70,58. Она также предлагает гибкость благодаря определениям векторов по всем размерностям и пользовательским инструкциям, позволяя разработчикам адаптировать модель к конкретным задачам, языкам или требованиям приложений.
Как создавать эмбеддинги с помощью Qwen3-Embedding-8B
Существует два основных способа генерации векторных эмбеддингов:
- PyMilvus: Python SDK для Milvus, который бесшовно интегрирует модель
Qwen3-Embedding-8B. - PAI-EAS: управляемый сервис для развертывания пользовательских моделей, таких как
Qwen3-Embedding-8B(для расширенной настройки).
После генерации векторных эмбеддингов их можно сохранить в Zilliz Cloud (полностью управляемом сервисе векторных баз данных на базе Milvus) и использовать для поиска семантического сходства. Вот четыре ключевых шага:
- Зарегистрируйтесь для бесплатного аккаунта Zilliz Cloud.
- Настройте бессерверный кластер и получите Public Endpoint и API Key.
- Создайте векторную коллекцию и вставьте свои векторные эмбеддинги.
- Выполните семантический поиск по сохраненным эмбеддингам.
Создайте эмбеддинги через PyMilvus и вставьте их в Zilliz Cloud для семантического поиска
from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient
# Load the Qwen3-Embedding-8B model
ef = SentenceTransformerEmbeddingFunction(
"Qwen/Qwen3-Embedding-8B", trust_remote_code=True
)
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
# Generate embeddings for documents
docs_embeddings = ef(docs)
queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)
# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)
COLLECTION = "qwen3_embedding_8b_documents"
# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)
# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
# Search for similar documents
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
# consistency_level="Strong", # Strong consistency ensures accurate results but may increase latency
output_fields=["text"],
limit=2,
)
# Print search results
for i, query in enumerate(queries):
print(f"\nQuery: {query}")
for result in results[i]:
print(f" - {result['entity']['text']} (distance: {result['distance']:.4f})")
Для получения дополнительной информации обратитесь к нашей документации по модели эмбеддингов PyMilvus.
Беспрерывные AI рабочие процессы
От встраиваний до масштабируемого AI поиска—Zilliz Cloud позволяет вам хранить, индексировать и извлекать встраивания с непревзойденной скоростью и эффективностью.
Попробуйте Zilliz Cloud Бесплатно




