Was ist neu in Milvus 2.3 Beta – 10-mal schneller mit GPUs
Wir sind stolz darauf, im Namen der Milvus-Community die Beta-Version von Milvus 2.3 anzukündigen. Diese Beta-Version enthält neue Funktionen und Verbesserungen, von denen wir sicher sind, dass sie die Leistung Ihrer KI-gestützten Anwendungen steigern werden. Wir freuen uns über Ihre Hilfe beim Testen einiger dieser Funktionen, damit wir schnell zur allgemeinen Veröffentlichung gelangen! In diesem Blogbeitrag werden einige der wichtigeren Funktionen vorgestellt. Eine vollständige Liste der Änderungen finden Sie in den Release Notes.
- 📦 PyPI: https://pypi.org/project/milvus/
- 📚 Docs: https://milvus.io/docs
- 🛠️ Release Notes: https://github.com/milvus-io/milvus/releases
- 🐳 Docker Image: docker pull milvusdb/milvus
- 🚀 Release: https://github.com/milvus-io/milvus/releases/tag/v2.3.0-beta
Eine der Funktionen von Milvus 2.3 Beta ist die Unterstützung für GPU-Beschleunigung und RAFT-basierte Integration, wodurch Milvus die Leistung moderner Grafikprozessoren voll ausschöpfen kann. Das GPU-beschleunigte Milvus bietet eine 10-mal schnellere Leistung als die reine CPU-Version. Dies kann die Geschwindigkeit und Reaktionsfähigkeit Ihrer KI- und Machine-Learning-gestützten Anwendungen erheblich verbessern und eine schnellere und genauere Datenverarbeitung ermöglichen.
Eine weitere wichtige Funktion von Milvus 2.3 Beta ist die Unterstützung der Bereichssuche, die es Benutzern ermöglicht, innerhalb eines festgelegten Bereichs nach Daten zu suchen. Dies kann besonders nützlich für Anwendungen sein, die komplexe Datenabfragen erfordern, da es eine präzisere und genauere Suche ermöglicht. Darüber hinaus unterstützt Milvus 2.3 Beta auch mmap und inkrementelle Backups, die alle dazu beitragen können, die Leistung und Effizienz Ihrer KI-Anwendungen weiter zu steigern. Durch eine effizientere Verwaltung und Speicherung von Daten können diese Funktionen sicherstellen, dass Ihre KI-Systeme kontinuierlich auf Spitzenniveau arbeiten.
Insgesamt sind die Verbesserungen in dieser Version für jeden Entwickler, der Anwendungen mit Ähnlichkeitssuchfunktionen erstellt, unverzichtbar.
Nvidia-GPU-Unterstützung Diese neue Funktion bietet die Möglichkeit, heterogenes Computing zu unterstützen, was spezialisierte Workloads erheblich beschleunigen kann. Diese neue Ergänzung ermöglicht es Benutzern, schnellere und effizientere Vektordatensuchen zu erwarten, was letztendlich Produktivität und Leistung verbessert. Wir haben RAFT-IVF-Flat (GPU) mit IVF-Flat (CPU) und HNSW (CPU) auf vier Datensätzen bei einem Recall von 95 % verglichen. Der GPU-Index erreichte im Durchschnitt einen 32-fach bzw. 8-fach höheren Durchsatz als IVF-Flat und HNSW. Die Bewertungsergebnisse sind in Tabelle 1 dargestellt. (Diese Benchmarks wurden gegen Knowhere auf einem Host mit einer 8-Core-CPU, 32 GB RAM und einer Nvidia A100 GPU ausgeführt.)
Tabelle 1. Die QPS von IVF-Flat, HNSW, RAFT-IVF-Flat auf vier Datensätzen bei 95 % Recall
| SIFT | GIST | GLOVE | DEEP | |
|---|---|---|---|---|
| IVF-Flat (CPU) | 3097 | 142 | 791 | 723 |
| HNSW (CPU) | 14,537 | 791 | 1,516 | 5,761 |
| RAFT-IVF-Flat (GPU) | 121,568 | 5,737 | 20,163 | 16,557 |
Besonderer Dank gilt @wphicks und @cjnolet von Nvidia für ihre wertvollen Beiträge zum RAFT-Code.
Bereichssuche Die Bereichssuche ist eine andere Suchmethode als eine k-NN-Abfrage. k-NN-Abfragen geben eine feste Anzahl der nächsten Nachbarn zurück. Bei der Bereichssuche werden für eine gegebene Abfrage q und einen Distanzschwellenwert R alle Entitäten innerhalb der Distanz R von q zurückgegeben. Die Bereichssuche wird häufig verwendet, um alle relevanten Ergebnisse innerhalb eines festgelegten Bereichs zu finden. Beispielsweise kann sie bei der Datendeduplizierung oder der Erkennung von Urheberrechtsverletzungen helfen (ist aber nicht darauf beschränkt), ohne ähnliche Kandidaten zu übersehen.
Upsert Upsert ist eine Operation, die den Wert einer Entität aktualisiert, wenn sie bereits in einer Collection vorhanden ist, oder eine neue einfügt, wenn sie nicht vorhanden ist. Milvus bietet hohe Flexibilität beim Hinzufügen von Daten zu Ihren Collections. Derzeit gibt es insgesamt drei Optionen:
- Bulk Insert für hohen Durchsatz in Offline-Anwendungsfällen.
- Insert für niedrige Latenz in Online-Streaming-Anwendungsfällen.
- Upsert für Fälle, in denen Sie unsicher sind, ob Sie neue Entitäten aktualisieren oder einfügen sollen.
Change Data Capture (CDC) Change Data Capture (CDC) ist der Prozess, Änderungen an Daten in einer Vektordatenbank in Echtzeit zu identifizieren und zu erfassen und diese Änderungen an nachgelagerte Systeme zu liefern. Milvus bietet nun Backup und Synchronisierung ohne Ausfallzeiten auf Grundlage dieses Mechanismus. Entwickler können CDC außerdem nutzen, um einen kontinuierlichen Strom von Änderungen für ihre nachgelagerten Workloads, wie Datenanalysen oder benutzerdefinierte Audits, zu erfassen und bereitzustellen.
Memory-mapped (mmap) file I/O In Szenarien mit unzureichendem Speicher bei großen Datensätzen und wenn die Abfrageleistung nicht kritisch ist, verwendet Milvus mmap, damit das System Teile einer Datei so behandeln kann, als befänden sie sich im Speicher, wodurch die Speichernutzung reduziert und die Leistung verbessert wird, wenn sich alle Daten im System-Page-Cache befinden.
Zusammenfassung
Zusätzlich zu allen oben aufgeführten Funktionen enthält Milvus 2.3 Beta mehrere Fehlerbehebungen und Verbesserungen. Um mehr zu erfahren:
- Lesen Sie die Versionshinweise für Version 2.3 Beta für die vollständige Liste der Änderungen
- Laden Sie Milvus herunter und legen Sie los
- Sehen Sie sich die Milvus-Benchmarks in diesem Whitepaper an
Weiterlesen

Zilliz Cloud Update: Smarter Autoscaling for Cost Savings, Stronger Compliance with Audit Logs, and More
What's new in Zilliz Cloud? Smarter autoscaling with scale-down, audit logs GA, enhanced SSO, and Milvus 2.6 in Private Preview.

Legal Document Analysis: Harnessing Zilliz Cloud's Semantic Search and RAG for Legal Insights
Enhance legal document analysis with Zilliz Cloud’s Semantic Search and RAG. Improve accuracy, efficiency, and scalability for contracts, case law, and compliance.

Top 5 AI Search Engines to Know in 2025
Discover the top AI-powered search engines of 2025, including OpenAI, Google AI, Bing, Perplexity, and Arc Search. Compare features, strengths, and limitations.



