Bosch erzielt 80 % Kostensenkung und optimierte Sucheffizienz mit Milvus

80 %
Senkung der Kosten für die Datenerhebung
~1,4 Mio. $
Senkung der jährlichen Lagerkosten
Millisekunden-Ebene
Abruf von Milliarden von Datenpunkten mit einer skalierbaren Architektur
When we identify a need for specific data, we can often find the required data in our database the same day using text or image search with Milvus. This greatly improves our data processing efficiency and has a positive effect on our business operations.
Mr. Zhang
Über BOSCH
Mit Hauptsitz in Deutschland ist BOSCH ein weltweit führendes Unternehmen im Bereich Automobiltechnologien und -komponenten, das für seine wegweisenden Innovationen und langjährige Expertise im autonomen Fahren bekannt ist. Das Unternehmen bietet hochmoderne Lösungen für autonomes Fahren, darunter fortschrittliche Fahrerassistenzsysteme (ADAS) wie adaptive Geschwindigkeitsregelung, Spurhalteassistent und automatische Parksysteme, denen führende Automobilhersteller weltweit vertrauen.
Die Herausforderung: Beschaffung von Bilddatensätzen für Corner Cases
Im autonomen Fahren beziehen sich „Corner Cases“ auf seltene, unerwartete oder extreme Situationen wie plötzlich auftretenden dichten Nebel, starken Regen, Schneestürme oder unerwartete Hindernisse wie Fußgänger, Tiere oder unkonventionelle Fahrzeuge. Diese Situationen stellen erhebliche Herausforderungen für die Wahrnehmungssysteme autonomer Fahrzeuge dar, einschließlich Radar, Kameras und LiDAR.
Automobilingenieure müssen sicherstellen, dass autonome Fahrsysteme diese Edge Cases sicher und zuverlässig bewältigen können. Die Beschaffung von Bilddatensätzen, die diese komplexen Situationen genau darstellen, ist jedoch problematisch, da solche Fälle nicht häufig auftreten und oft spezielle Bedingungen oder Umgebungen erfordern, um sie zu reproduzieren. Die Erfassung dieses „Corner Case“-Bilddatensatzes mit traditionellen Datenerfassungsmethoden ist sowohl zeitaufwendig als auch teuer und stellt ein erhebliches Hindernis für Entwickler dar, die die Sicherheit und Zuverlässigkeit autonomer Fahrzeuge verbessern möchten.
Das Intelligent Drive Control Team von BOSCH stand genau vor dieser Herausforderung. Es musste einen Weg finden, Bilddatensätze effizient und kostengünstig zu sammeln, die diese schwierigen Situationen genau abbilden können. Ohne solche Daten wäre es unmöglich, die autonomen Systeme gründlich zu testen und zu verfeinern, damit sie unter allen Bedingungen sicher funktionieren.
Erkundung von KI-Lösungen: Integration von LLMs und Vektordatenbanken
Um seine Herausforderungen zu bewältigen, hat das Intelligent Drive Control Team von BOSCH im Laufe der Jahre verschiedene Strategien untersucht.
Zunächst sammelte das Team Daten für Corner Cases manuell. Dieser Ansatz erforderte eine große Fahrzeugflotte und erheblichen Personaleinsatz, um auf diese seltenen Szenarien zu warten und Daten zu sammeln. Er war zeitaufwendig, ineffizient und abhängig von zufälligen Begegnungen mit den gewünschten Bedingungen, was zu langen Projektlaufzeiten führte.
Als Nächstes wandte sich das Team Knowledge Graphs (KGs) zu, um Datenpunkte mit bestimmten Attributen oder Klassifizierungen zu kennzeichnen. Obwohl dieser Ansatz die Organisation, den Abruf und die Analyse von Daten erleichterte, machte die enorme Vielfalt an Corner Cases es zu einer gewaltigen Aufgabe, jeden einzelnen eindeutig zu kennzeichnen.
Beide Methoden hatten Nachteile, darunter hohe Kosten, geringe Effizienz und begrenzte Abdeckung.
Mit den Fortschritten in KI-Technologien, insbesondere large language models (LLMs) wie ChatGPT, Vektordatenbanken und retrieval augmented generation (RAG), begann BOSCH, effizientere Lösungen zur Bewältigung seiner Herausforderungen zu erkunden. Das Unternehmen nutzte Large Vision Models (LVMs) und Large Multimodal Models (LMMs), um gesammelte Bilder in Vektoreinbettungen umzuwandeln. Durch den Einsatz einer Vektordatenbank konnten sie hocheffiziente Text-zu-Bild- oder Bild-zu-Bild-Suchen durchführen.
Das Team identifizierte schnell geeignete LMM- und LVM-Modelle für Image Embedding. Die eigentliche Herausforderung bestand jedoch in der Skalierung der Vektorähnlichkeitssuche, wodurch Vektordatenbanken zu einer entscheidenden Komponente dieser innovativen Lösung wurden.
Der Weg zur Wahl von Milvus als Lösung für die Ähnlichkeitssuche
BOSCH setzt auf vortrainierte KI-Modelle mit Milliarden von Parametern und Merkmalsdimensionen von über 1.000. Bei einem 1.024-dimensionalen Merkmalsvektor beispielsweise benötigt jeder Gleitkommawert (4 Byte) etwa 4KB Speicher. Bei der Verarbeitung riesiger Datensätze kann dieser Speicherbedarf zu einem enormen Ressourcenverbrauch führen und sowohl die Speicher- als auch die Rechenkosten in die Höhe treiben.
Das Volumen der Bilddaten von BOSCH ist immens—derzeit liegt es im zweistelligen Milliardenbereich und wächst weiter. Nach Clustering und Deduplizierung beläuft sich die für die Ähnlichkeitssuche in einer Vektordatenbank benötigte Datenmenge immer noch auf Milliarden.
Um diese Herausforderung zu bewältigen, implementierte BOSCH Quantisierungsindizierungs- und Sharding-Technologien, um den Ressourcenverbrauch zu minimieren und die Effizienz der Datenverarbeitung zu verbessern. Quantisierungs-Indizierung ist ideal, um groß angelegte Daten effizient zu speichern und hochdimensionale Merkmale zu indizieren. Sharding bewältigt wachsende Datenmengen, ermöglicht groß angelegte Echtzeitabfragen und optimiert die Nutzung von Rechenressourcen. Das Team untersuchte mehrere Ansätze:
HNSW (Hierarchical Navigable Small Worlds)-Graphindizierung: Viele Frage-Antwort-Systeme verwenden HNSW-Graphindizierung für Aufgaben der Verarbeitung natürlicher Sprache (NLP). Obwohl es sich um eine beliebte und unkomplizierte Methode handelt, erfordert HNSW die direkte Speicherung hochdimensionaler Merkmale in der Bibliothek des Algorithmus, was zu hohem Ressourcenverbrauch und hohen Kosten führt.
Vektorsuch-Plugins auf traditionellen Datenbanken: Das Hinzufügen von ****Vektorfeldern zu traditionellen relationalen Datenbanken ist eine der verfügbaren Vektorsuchlösungen. Bei Quantisierungsindex-Algorithmen erfordern Sharding-Aktualisierungen jedoch ein erneutes Training von Codebooks, was zusätzliche Komplexität mit sich bringt. Folglich unterstützen traditionelle Datenbanken mit Vektorsuchfunktionalität in der Regel nur HNSW-Indizierung, die den Anforderungen von BOSCH an die Verarbeitung und Abfrage groß angelegter Vektordaten nicht gerecht wird.
Ingenieur Zhang, leitender Softwareingenieur bei BOSCH, erklärte: „Wir brauchen eine Indizierungstechnologie, die komplexe Suchanforderungen und generative Modelle bewältigen, Trainingskosten senken, die Aktualisierungseffizienz verbessern und sich flexibel an sich entwickelnde Daten- und Abfrageanforderungen anpassen kann.“
Eine spezialisierte Vektordatenbank erwies sich als die beste Lösung für die Anforderungen von BOSCH. Nach der Bewertung verschiedener Optionen entschied sich BOSCH für Milvus als Vektorsuchlösung.
Die Ergebnisse: 80% Kostensenkung und optimierte Sucheffizienz
Milvus ist eine Open-Source-Vektordatenbank, die Milliarden von Vektoren in Millisekunden speichern, indizieren und abrufen kann. Selbst bei den enormen und weiter wachsenden Datenmengen von BOSCH behält Milvus eine extrem hohe Leistung bei. Am wichtigsten ist, dass die Quantisierungsindizierungstechnologie von Milvus den Verbrauch von Speicher- und Rechenressourcen erheblich reduziert, wodurch BOSCH groß angelegte Datensätze leichter verwalten kann.
80% Senkung der Datenerfassungskosten
Die effizienten Ähnlichkeitssuchfunktionen von Milvus ermöglichen es BOSCH, 70%-80% der benötigten Corner-Case-Daten aus bestehenden Datenbanken abzurufen, wodurch der Bedarf an neuer Datenerfassung reduziert wird. Darüber hinaus ermöglicht Milvus einen nahezu sofortigen Abruf, wenn die erforderlichen Daten bereits in der Datenbank vorhanden sind, was die Effizienz des Data Mining erheblich verbessert.
Zhang erklärte: „Wenn wir einen Bedarf an bestimmten Corner-Case-Daten feststellen, können wir die erforderlichen Daten häufig noch am selben Tag in unserer Datenbank mithilfe der Text- oder Bildsuche mit Milvus finden. Dies verbessert unsere Effizienz bei der Datenverarbeitung erheblich und wirkt sich positiv auf unsere Geschäftsabläufe aus.“
Fast $1.4M Senkung der jährlichen Speicherkosten
Die Verringerung des Bedarfs an externer Datenerfassung hat auch die Speicherkosten erheblich gesenkt. Zhang fügte hinzu: „Sich ausschließlich auf externe Datenerfassung zu verlassen, könnte jährlich fast 1,4 Millionen Dollar kosten.“
Optimierte Sucheffizienz
Die Quantisierungs-Indexierungstechnologie von Milvus reduziert den Verbrauch von Speicher- und Rechenressourcen erheblich. BOSCH kann Daten nun flexibler und effizienter verarbeiten und die Leistungsbeschränkungen traditioneller Datenbanken überwinden. Milvus bietet außerdem segmentierte und geshardete Suchmethoden, wodurch die Effizienz gesteigert und aktuelle Herausforderungen mit großskaligen und hochdimensionalen Daten bewältigt werden.
Abruf auf Millisekunden-Niveau für Milliarden von Datenpunkten mit einer skalierbaren Architektur
Das autonome Fahrgeschäft von BOSCH ist cloudbasiert. Die cloud-native Architektur von Milvus vereinfacht die Bereitstellung und Skalierung. Sie bietet hervorragende Skalierbarkeit, die für BOSCHs Datenoperationen im Milliardenbereich entscheidend ist. Wenn der Datensatz wächst, muss das Team nur mit einem Klick die benötigten Ressourcen skalieren. Zhang erwähnte: „Selbst bei zahlreichen gleichzeitigen Suchanfragen haben wir keine Verlangsamung der Suchgeschwindigkeit bemerkt.“
Aktive Community-Unterstützung
Milvus ist eine der beliebtesten, sich schnell weiterentwickelnden und ausgereiften Open-Source-Vektordatenbanken mit einer großen und aktiven Nutzer- und Entwickler-Community weltweit. Zhang kommentierte: „Die Milvus-Community ist sehr aktiv. Wann immer wir Probleme hatten, erhielten wir umgehend Antworten aus der Community.“
Zukunftspläne: Die Hybrid-Search-Fähigkeit von Milvus erkunden
Um Datenvielfalt sicherzustellen, werden Tausende von Beispielbildern benötigt. Derzeit priorisiert BOSCH Text-zu-Bild-Suchen und greift auf Bild-zu-Bild-Suchen zurück, wenn die Textergebnisse nicht gut genug sind. Die Unterstützung von Milvus für Multi-Vektor-Spalten und hybride Suchen macht bedarfsgesteuerte Bild-zu-Bild-Suchen praktikabler. Zum Beispiel hilft die Kombination von Wetterbildern mit Kegelbildern dabei, nach verschiedenen Wetterbedingungen mit Kegeln zu suchen, oder das Überlagern dreieckiger Verkehrsschilder mit beschreibendem Text, um nach unterschiedlichen Warnfunktionen zu suchen. Dies ist eine Richtung, die BOSCH und Milvus gemeinsam weiter erkunden werden.
Das volle Potenzial von Milvus im autonomen Fahren freisetzen
Milvus ist nicht nur ein Werkzeug – es ist ein strategischer Verbündeter für BOSCH im Bereich des autonomen Fahrens. Mit Milvus kann BOSCH tiefer in Daten eintauchen und deren Potenzial nutzen, was ihnen einen entscheidenden Vorteil im Streben nach intelligenterem und sichererem Fahren verschafft. Die Einführung von Milvus hat verändert, wie BOSCH mit Daten umgeht, und macht jeden Schritt – von der Erfassung über die Verarbeitung bis hin zur Anwendung – effizienter und genauer.
Während BOSCH in die Zukunft blickt, ist das Unternehmen bestrebt, weitere hochmoderne Fähigkeiten von Milvus zu erkunden und die nächste Generation sichererer, intelligenterer und komfortablerer Fahrerlebnisse voranzutreiben.
- Über BOSCH
- Die Herausforderung: Beschaffung von Bilddatensätzen für Corner Cases
- Erkundung von KI-Lösungen: Integration von LLMs und Vektordatenbanken
- Der Weg zur Wahl von Milvus als Lösung für die Ähnlichkeitssuche
- Die Ergebnisse: 80% Kostensenkung und optimierte Sucheffizienz
- Zukunftspläne: Die Hybrid-Search-Fähigkeit von Milvus erkunden
- Das volle Potenzial von Milvus im autonomen Fahren freisetzen
Inhalte
Anwendungsfall
Branche
Automobilindustrie
Even with numerous concurrent searches, we didn’t notice any slowdown in search speed with Milvus.
Mr. Zhang


