Google / EmbeddingGemma
Milvus Integrated
Tâche: Intégration
Modalité: Texte
Métrique de similarité: Cosinus, produit de points
Licence: gemma
Dimensions: 768
Tokens d'entrée max: 2048
Prix: Gratuit
Introduction à EmbeddingGemma
Le modèle EmbeddingGemma est un modèle d’embedding de texte multilingue de 308M de paramètres de Google, construit sur Gemma 3 (avec initialisation T5Gemma) et développé à partir des mêmes fondements de recherche que ceux des modèles Gemini. Il est bien adapté aux tâches de recherche et de récupération, notamment la classification, le clustering et la recherche de similarité sémantique.
EmbeddingGemm prend en charge plus de 100 langues et offre des dimensions de sortie flexibles (de 768 à 128) via Matryoshka Representation Learning (MRL). Avec une fenêtre de contexte de 2K tokens et une empreinte mémoire inférieure à 200MB une fois quantifié, EmbeddingGemma fonctionne efficacement sur du matériel aux ressources limitées. Il peut être déployé sur des appareils du quotidien, tels que les téléphones, les ordinateurs portables et les tablettes, rendant les capacités avancées d’embedding de texte accessibles dans un large éventail de contextes.
Comment créer des embeddings avec EmbeddingGemma
Il existe deux façons principales de générer des embeddings vectoriels :
- PyMilvus : le SDK Python pour Milvus qui intègre de manière transparente le modèle
EmbeddingGemma. - Bibliothèque SentenceTransformer : la bibliothèque Python
sentence-transformer.
Une fois les embeddings vectoriels générés, ils peuvent être stockés dans Zilliz Cloud (un service de base de données vectorielle entièrement géré propulsé par Milvus) et utilisés pour la recherche de similarité sémantique. Voici quatre étapes clés :
- Inscrivez-vous gratuitement pour créer un compte Zilliz Cloud.
- Configurez un cluster serverless et obtenez le Public Endpoint et l’API Key.
- Créez une collection vectorielle et insérez vos embeddings vectoriels.
- Exécutez une recherche sémantique sur les embeddings stockés.
Créer des embeddings via PyMilvus et les insérer dans Zilliz Cloud pour la recherche sémantique
from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient
# Load the Google EmbeddingGemma-300M model
ef = SentenceTransformerEmbeddingFunction(
"google/embeddinggemma-300m", trust_remote_code=True
)
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
# Generate embeddings for documents
docs_embeddings = ef(docs)
queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)
# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)
COLLECTION = "embeddinggemma_300m_documents"
# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)
# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
# Search for similar documents
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
# consistency_level="Strong", # Strong consistency ensures accurate results but may increase latency
output_fields=["text"],
limit=2,
)
# Print search results
for i, query in enumerate(queries):
print(f"\nQuery: {query}")
for result in results[i]:
print(f" - {result['entity']['text']} (distance: {result['distance']:.4f})")
Pour plus d’informations, consultez notre documentation du modèle d’embedding PyMilvus.
Workflows IA fluides
Des embeddings à la recherche IA évolutive - Zilliz Cloud vous permet de stocker, indexer et récupérer des embeddings avec une vitesse et une efficacité inégalées.
Essayer Zilliz Cloud gratuitement




