Milvus führte MMap für neu definierte Datenverwaltung und erhöhte Speicherkapazität ein
Milvus ist die schnellste Lösung unter den Open-Source-Vektordatenbanken und richtet sich an Nutzer mit hohen Leistungsanforderungen. Die Vielfalt der Nutzerbedürfnisse spiegelt jedoch die Daten wider, mit denen sie arbeiten. Einige priorisieren budgetfreundliche Lösungen und umfangreichen Speicher gegenüber reiner Geschwindigkeit. Im Verständnis dieses Spektrums an Anforderungen führt Milvus die MMap-Funktion ein und definiert damit neu, wie wir große Datenmengen handhaben, während Kosteneffizienz versprochen wird, ohne Funktionalität zu opfern.
Was ist MMap?
MMap, kurz für memory-mapped files, überbrückt die Lücke zwischen Dateien und Speicher innerhalb von Betriebssystemen. Diese Technologie ermöglicht es Milvus, große Dateien direkt in den Speicherbereich des Systems abzubilden und Dateien in zusammenhängende Speicherblöcke umzuwandeln. Diese Integration macht explizite Lese- oder Schreiboperationen überflüssig und verändert grundlegend, wie Milvus Daten verwaltet. Sie gewährleistet nahtlosen Zugriff und effiziente Speicherung für große Dateien oder Situationen, in denen Nutzer zufällig auf Dateien zugreifen müssen.
Wer profitiert von MMap?
Vektordatenbanken erfordern aufgrund der Speicheranforderungen von Vektordaten erhebliche Speicherkapazitäten. Mit der MMap-Funktion wird die Verarbeitung größerer Datenmengen innerhalb begrenzten Speichers Realität. Diese erhöhte Fähigkeit geht jedoch mit Leistungseinbußen einher. Das System verwaltet den Speicher intelligent und entfernt einige Daten basierend auf Last und Nutzung. Diese Entfernung ermöglicht es Milvus, mehr Daten innerhalb derselben Speicherkapazität zu verarbeiten.
Während unserer Tests beobachteten wir, dass bei reichlich Speicher nach einer Aufwärmphase alle Daten im Speicher liegen, wodurch die Systemleistung erhalten bleibt. Mit zunehmendem Datenvolumen nimmt die Leistung jedoch allmählich ab. Daher empfehlen wir die MMap-Funktion für Nutzer, die weniger empfindlich auf Leistungsschwankungen reagieren.
MMap in Milvus aktivieren: eine einfache Konfiguration
Die Aktivierung von MMap in Milvus ist bemerkenswert unkompliziert. Alles, was Sie tun müssen, ist die Datei milvus.yaml zu ändern: Fügen Sie den Eintrag mmapDirPath unter der Konfiguration queryNode hinzu und legen Sie einen gültigen Pfad als Wert fest.
Das Gleichgewicht finden: Leistung, Speicher und Systemgrenzen
Datenzugriffsmuster haben einen erheblichen Einfluss auf die Leistung. Die MMap-Funktion von Milvus optimiert den Datenzugriff basierend auf Lokalität. MMap ermöglicht es Milvus, skalare Daten für sequenziell zugängliche Datensegmente direkt auf die Festplatte zu schreiben. Daten variabler Länge wie Zeichenketten werden abgeflacht und mithilfe eines Offsets-Arrays im Speicher indiziert. Dieser Ansatz gewährleistet Lokalität beim Datenzugriff und beseitigt den Overhead, jede variable Datenlänge separat zu speichern. Optimierungen für Vektorindizes sind sorgfältig ausgearbeitet. MMap wird selektiv für Vektordaten eingesetzt, während Adjazenzlisten im Speicher verbleiben, wodurch erheblicher Speicher eingespart wird, ohne die Leistung zu beeinträchtigen.
Darüber hinaus maximiert MMap die Datenverarbeitung durch Minimierung der Speichernutzung. Im Gegensatz zu früheren Milvus-Versionen, bei denen QueryNode ganze Datensätze kopierte, verwendet MMap während der Entwicklung einen optimierten, kopierfreien Streaming-Prozess. Diese Optimierung reduziert den Speicher-Overhead drastisch.
Unsere internen Testergebnisse zeigen, dass Milvus bei aktivierter MMap-Funktion effizient die doppelte Datenmenge verarbeiten kann.
Der Weg nach vorn: kontinuierliche Innovation und nutzerzentrierte Verbesserungen
Während sich die MMap-Funktion in der Beta-Phase befindet, ist das Milvus-Team der kontinuierlichen Verbesserung verpflichtet. Zukünftige Updates werden die Speichernutzung des Systems verfeinern und Milvus ermöglichen, noch umfangreichere Datenmengen auf einem einzelnen Knoten zu unterstützen. Nutzer können eine granularere Kontrolle über die MMap-Funktion erwarten, die dynamische Änderungen an Collections und erweiterte Modi zum Laden von Feldern ermöglicht. Diese Verbesserungen bieten beispiellose Flexibilität und erlauben es Nutzern, ihre Datenverarbeitungsstrategien an spezifische Anforderungen anzupassen.
Fazit: Datenverarbeitungsexzellenz mit Milvus MMap neu definieren
Die MMap-Funktion von Milvus 2.3 markiert einen bedeutenden Sprung in der Datenverarbeitungstechnologie. Durch ein fein abgestimmtes Gleichgewicht zwischen Leistung, Kosten und Systemgrenzen ermöglicht Milvus den Nutzern, riesige Datenmengen effizient und kosteneffektiv zu verarbeiten. Während sich Milvus kontinuierlich weiterentwickelt, bleibt es an der Spitze innovativer Lösungen und definiert die Grenzen dessen, was im Datenmanagement erreichbar ist, neu.
Bleiben Sie gespannt auf weitere bahnbrechende Entwicklungen, während Milvus seinen Weg zu beispielloser Exzellenz in der Datenverarbeitung fortsetzt.
Weiterlesen

DeepSeek-OCR Explained: Optical Compression for Scalable Long-Context and RAG Systems
Discover how DeepSeek-OCR uses visual tokens and Contexts Optical Compression to boost long-context LLM efficiency and reshape RAG performance.

Zilliz Named "Highest Performer" and "Easiest to Use" in G2's Summer 2025 Grid® Report for Vector Databases
Zilliz shines in G2's Summer 2025 Grid® Report as both "Highest Performer" and "Easiest to Use," solving the performance-usability dilemma.

Cosmos World Foundation Model Platform for Physical AI
NVIDIA's Cosmos platform enables safe, digital twin training of GenAI models for physical applications, overcoming data scarcity and safety challenges.



