Google / EmbeddingGemma
Milvus Integrated
Aufgabe: Einbettung
Modalität: Text
Ähnlichkeitsmetrik: Kosinus, Punktprodukt
Lizenz: gemma
Dimensionen: 768
Maximale Eingabe-Tokens: 2048
Preis: Kostenlos
Einführung in EmbeddingGemma
Das EmbeddingGemma-Modell ist ein mehrsprachiges Text-Embedding-Modell von Google mit 308M Parametern, das auf Gemma 3 basiert (mit T5Gemma-Initialisierung) und unter Verwendung derselben Forschungsgrundlagen entwickelt wurde, die den Gemini-Modellen zugrunde liegen. Es eignet sich gut für Such- und Retrieval-Aufgaben, einschließlich Klassifizierung, Clustering und semantischer Ähnlichkeitssuche.
EmbeddingGemm unterstützt über 100 Sprachen und bietet flexible Ausgabedimensionen (von 768 bis hinunter zu 128) über Matryoshka Representation Learning (MRL). Mit einem Kontextfenster von 2K Tokens und einem Speicherbedarf von unter 200MB bei Quantisierung läuft EmbeddingGemma effizient auf ressourcenbeschränkter Hardware. Es kann auf Alltagsgeräten wie Smartphones, Laptops und Tablets bereitgestellt werden und macht fortschrittliche Text-Embedding-Funktionen in einer Vielzahl von Umgebungen zugänglich.
So erstellen Sie Embeddings mit EmbeddingGemma
Es gibt zwei primäre Möglichkeiten, Vektor-Embeddings zu generieren:
- PyMilvus: das Python SDK für Milvus, das das
EmbeddingGemma-Modell nahtlos integriert. - SentenceTransformer-Bibliothek: die Python-Bibliothek
sentence-transformer.
Sobald die Vektor-Embeddings generiert wurden, können sie in Zilliz Cloud (einem vollständig verwalteten Vektordatenbankdienst auf Basis von Milvus) gespeichert und für die semantische Ähnlichkeitssuche verwendet werden. Hier sind vier wichtige Schritte:
- Registrieren Sie sich kostenlos für ein Zilliz Cloud-Konto.
- Richten Sie einen serverlosen Cluster ein und erhalten Sie den Public Endpoint und API Key.
- Erstellen Sie eine Vektorsammlung und fügen Sie Ihre Vektor-Embeddings ein.
- Führen Sie eine semantische Suche auf den gespeicherten Embeddings aus.
Embeddings über PyMilvus erstellen und für die semantische Suche in Zilliz Cloud einfügen
from pymilvus.model.dense import SentenceTransformerEmbeddingFunction
from pymilvus import MilvusClient
# Load the Google EmbeddingGemma-300M model
ef = SentenceTransformerEmbeddingFunction(
"google/embeddinggemma-300m", trust_remote_code=True
)
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
# Generate embeddings for documents
docs_embeddings = ef(docs)
queries = ["When was artificial intelligence founded", "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)
# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(uri=ZILLIZ_PUBLIC_ENDPOINT, token=ZILLIZ_API_KEY)
COLLECTION = "embeddinggemma_300m_documents"
# Drop collection if it exists
if client.has_collection(collection_name=COLLECTION):
client.drop_collection(collection_name=COLLECTION)
# Create collection with auto-detected dimension
client.create_collection(collection_name=COLLECTION, dimension=ef.dim, auto_id=True)
# Insert documents with embeddings
for doc, embedding in zip(docs, docs_embeddings):
client.insert(COLLECTION, {"text": doc, "vector": embedding})
# Search for similar documents
results = client.search(
collection_name=COLLECTION,
data=query_embeddings,
# consistency_level="Strong", # Strong consistency ensures accurate results but may increase latency
output_fields=["text"],
limit=2,
)
# Print search results
for i, query in enumerate(queries):
print(f"\nQuery: {query}")
for result in results[i]:
print(f" - {result['entity']['text']} (distance: {result['distance']:.4f})")
Weitere Informationen finden Sie in unserer Dokumentation zum PyMilvus Embedding Model.
Nahtlose KI-Workflows
Von Embeddings bis hin zu skalierbarer KI-Suche – Zilliz Cloud ermöglicht es Ihnen, Embeddings mit beispielloser Geschwindigkeit und Effizienz zu speichern, zu indizieren und abzurufen.
Zilliz Cloud kostenlos ausprobieren




