Руководство по Qwen3-Embedding-8B

Все модели
Alibaba / Qwen3-Embedding-8B

Alibaba / Qwen3-Embedding-8B

AI Model Milvus Integrated

Задача: Встраивание

Модальность: Текст

Метрика сходства: Косинус

Лицензия: Apache 2.0

Размерности: 4096

Максимальное количество входных токенов: 32000

Цена: Бесплатно

Введение в Qwen3-Embedding-8B

Модель Qwen3-Embedding-8B — это модель текстовых эмбеддингов Alibaba с 8 миллиардами параметров в серии Qwen3 Embedding. Построенная на плотной архитектуре Qwen3, она поддерживает длину контекста 32k и предлагает мощные многоязычные возможности для 100+ человеческих языков и языков программирования, обеспечивая эффективную производительность в поиске текста, поиске по коду и межъязыковых сценариях.

Qwen3-Embedding-8B обеспечивает передовую производительность в приложениях текстовых эмбеддингов и в настоящее время занимает 1-е место в многоязычном рейтинге MTEB (5 июня 2025 г.) с результатом 70,58. Она также предлагает гибкость благодаря определениям векторов по всем размерностям и пользовательским инструкциям, позволяя разработчикам адаптировать модель к конкретным задачам, языкам или требованиям приложений.

Как создавать эмбеддинги с помощью Qwen3-Embedding-8B

Существует два основных способа генерации векторных эмбеддингов:

PyMilvus: Python SDK для Milvus, который бесшовно интегрирует модель Qwen3-Embedding-8B.
PAI-EAS: управляемый сервис для развертывания пользовательских моделей, таких как Qwen3-Embedding-8B (для расширенной настройки).

После генерации векторных эмбеддингов их можно сохранить в Zilliz Cloud (полностью управляемом сервисе векторных баз данных на базе Milvus) и использовать для поиска семантического сходства. Вот четыре ключевых шага:

Зарегистрируйтесь для бесплатного аккаунта Zilliz Cloud.
Настройте бессерверный кластер и получите Public Endpoint и API Key.
Создайте векторную коллекцию и вставьте свои векторные эмбеддинги.
Выполните семантический поиск по сохраненным эмбеддингам.

Создайте эмбеддинги через PyMilvus и вставьте их в Zilliz Cloud для семантического поиска

from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient

# Load the Qwen3-Embedding-8B model
ef = SentenceTransformerEmbeddingFunction(
    "Qwen/Qwen3-Embedding-8B", trust_remote_code=True
)

docs = [
    "Artificial intelligence was founded as an academic discipline in 1956.",
    "Alan Turing was the first person to conduct substantial research in AI.",
    "Born in Maida Vale, London, Turing was raised in southern England.",
]

# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]

# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)

COLLECTION = "qwen3_embedding_8b_documents"

# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
    client.drop_collection(collection_name=COLLECTION)

# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)

# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
    client.insert(COLLECTION, {"text": doc, "vector": embedding})

# Search for similar documents
results = client.search(
    collection_name=COLLECTION,
    data=query_embeddings,
    # consistency_level="Strong",  # Strong consistency ensures accurate results but may increase latency
    output_fields=["text"],
    limit=2,
)

# Print search results
for i, query in enumerate(queries):
    print(f"\nQuery: {query}")
    for result in results[i]:
        print(f"  - {result['entity']['text']} (distance: {result['distance']:.4f})")

Для получения дополнительной информации обратитесь к нашей документации по модели эмбеддингов PyMilvus.

Контент

Беспрерывные AI рабочие процессы

От встраиваний до масштабируемого AI поиска—Zilliz Cloud позволяет вам хранить, индексировать и извлекать встраивания с непревзойденной скоростью и эффективностью.

Попробуйте Zilliz Cloud Бесплатно

Быстро оцените стоимость вашего внедрения

Введение в Qwen3-Embedding-8B

Как создавать эмбеддинги с помощью Qwen3-Embedding-8B

Создайте эмбеддинги через PyMilvus и вставьте их в Zilliz Cloud для семантического поиска

Контент

Беспрерывные AI рабочие процессы

Связанные ресурсы

Оценка модели встраивания

Обучение собственной модели встраивания текста

Создавайте приложения для искусственного интеллекта с помощью технологии Retrieval Augmented Generation (RAG)