Bosch ottiene una riduzione dei costi dell’80% e un’efficienza di ricerca ottimizzata con Milvus

80%
Riduzione dei costi di raccolta dei dati
~1,4 M$
Riduzione dei costi annuali di archiviazione
A livello di millisecondi
Recupero di miliardi di punti dati con un'architettura scalabile
When we identify a need for specific data, we can often find the required data in our database the same day using text or image search with Milvus. This greatly improves our data processing efficiency and has a positive effect on our business operations.
Mr. Zhang
Informazioni su BOSCH
Con sede in Germania, BOSCH è un leader globale nelle tecnologie e nei componenti automobilistici, celebrato per le sue innovazioni pionieristiche e la sua consolidata esperienza nella guida autonoma. Offre soluzioni all’avanguardia per la guida autonoma, inclusi sistemi avanzati di assistenza alla guida (ADAS) come il controllo adattivo della velocità di crociera, l’assistenza al mantenimento della corsia e i sistemi di parcheggio automatizzato, considerati affidabili dai principali produttori automobilistici di tutto il mondo.
La sfida: acquisire dataset di immagini per i corner case
Nella guida autonoma, i "corner case" si riferiscono a situazioni rare, impreviste o estreme, come nebbia fitta improvvisa, pioggia intensa, tempeste di neve o ostacoli inattesi come pedoni, animali o veicoli non convenzionali. Queste situazioni pongono sfide significative ai sistemi di percezione dei veicoli autonomi, inclusi radar, telecamere e LiDAR.
Gli ingegneri automobilistici devono garantire che i sistemi di guida autonoma possano affrontare in modo sicuro e affidabile questi edge case. Tuttavia, acquisire dataset di immagini che rappresentino accuratamente queste situazioni complesse è problematico perché tali casi non si verificano frequentemente e spesso richiedono condizioni o ambienti specializzati per essere riprodotti. La raccolta di questo dataset di immagini di "corner case" con metodi tradizionali di raccolta dati è sia dispendiosa in termini di tempo sia costosa, rappresentando un ostacolo significativo per gli sviluppatori che mirano a migliorare la sicurezza e l’affidabilità dei veicoli autonomi.
Il team Intelligent Drive Control di BOSCH ha affrontato esattamente questa sfida. Doveva trovare un modo per raccogliere in modo efficiente ed economicamente sostenibile dataset di immagini che potessero raffigurare accuratamente queste situazioni difficili. Senza tali dati, sarebbe impossibile testare e perfezionare approfonditamente i sistemi autonomi affinché funzionino in sicurezza in tutte le condizioni.
Esplorare soluzioni di IA: integrazione di LLM e database vettoriali
Per affrontare le sue sfide, il team Intelligent Drive Control di BOSCH ha esplorato varie strategie nel corso degli anni.
Inizialmente, il team raccoglieva manualmente i dati per i corner case. Questo approccio richiedeva una grande flotta di veicoli e una manodopera significativa per attendere questi scenari rari e raccogliere dati. Era dispendioso in termini di tempo, inefficiente e dipendente da incontri casuali con le condizioni desiderate, portando a tempistiche di progetto prolungate.
Successivamente, il team si è rivolto ai knowledge graph (KG) per etichettare i punti dati con attributi o classificazioni specifiche. Sebbene questo approccio rendesse più semplice organizzare, recuperare e analizzare i dati, l’enorme varietà di corner case rendeva un compito enorme etichettare ciascuno di essi in modo univoco.
Entrambi i metodi presentavano svantaggi, tra cui costi elevati, bassa efficienza e copertura limitata.
Con i progressi nelle tecnologie di IA, in particolare i large language models (LLMs) come ChatGPT, i database vettoriali e la retrieval augmented generation (RAG), BOSCH ha iniziato a esplorare soluzioni più efficienti per affrontare le sue sfide. Ha sfruttato i large vision models (LVMs) e i large multimodal models (LMMs) per convertire le immagini raccolte in embedding vettoriali. Utilizzando un database vettoriale, poteva eseguire ricerche text-to-image o image-to-image altamente efficienti.
Il team ha rapidamente individuato modelli LMM e LVM adatti per l’embedding delle immagini. Tuttavia, la vera sfida era scalare la ricerca per similarità vettoriale, rendendo i database vettoriali un componente cruciale di questa soluzione innovativa.
Il percorso verso la scelta di Milvus come soluzione per la ricerca di similarità
BOSCH si affida a modelli di IA pre-addestrati con miliardi di parametri e dimensioni delle feature superiori a 1.000. Ad esempio, con un vettore di feature a 1.024 dimensioni, ogni valore in virgola mobile (4 byte) richiede circa 4 KB di memoria. Quando si gestiscono dataset enormi, questo requisito di archiviazione può portare a un consumo di risorse enorme, facendo aumentare sia i costi di archiviazione sia quelli computazionali.
Il volume dei dati di immagine di BOSCH è immenso: attualmente nell’ordine delle decine di miliardi e ancora in crescita. Dopo clustering e deduplicazione, i dati necessari per il recupero per similarità in un database vettoriale ammontano ancora a miliardi.
Per affrontare questa sfida, BOSCH ha implementato tecnologie di indicizzazione per quantizzazione e sharding per ridurre al minimo l’uso delle risorse e migliorare l’efficienza dell’elaborazione dei dati. L’indicizzazione per quantizzazione è ideale per archiviare in modo efficiente dati su larga scala e indicizzare feature ad alta dimensionalità. Lo sharding gestisce volumi di dati in crescita, rendendo possibile il recupero in tempo reale su larga scala e ottimizzando l’uso delle risorse computazionali. Il team ha esplorato diversi approcci:
Indicizzazione a grafo HNSW (Hierarchical Navigable Small Worlds): Molti sistemi di domanda e risposta utilizzano l’indicizzazione a grafo HNSW per attività di elaborazione del linguaggio naturale (NLP). Sebbene sia un metodo popolare e semplice, HNSW richiede l’archiviazione delle feature ad alta dimensionalità direttamente nella libreria dell’algoritmo, portando a un elevato consumo di risorse e a costi elevati.
Plugin di ricerca vettoriale su database tradizionali: L’aggiunta di campi vettoriali ai database relazionali tradizionali è una delle soluzioni di ricerca vettoriale disponibili. Tuttavia, per gli algoritmi di indicizzazione per quantizzazione, gli aggiornamenti dello sharding richiedono il riaddestramento dei codebook, il che aggiunge complessità. Di conseguenza, i database tradizionali con funzionalità di ricerca vettoriale di solito supportano solo l’indicizzazione HNSW, che non soddisfa le esigenze di BOSCH per l’elaborazione e il recupero di dati vettoriali su larga scala.
L’ingegnere Zhang, principal software engineer di BOSCH, ha spiegato: “Abbiamo bisogno di una tecnologia di indicizzazione in grado di gestire requisiti di ricerca complessi e modelli generativi, ridurre i costi di training, migliorare l’efficienza degli aggiornamenti e adattarsi in modo flessibile all’evoluzione dei dati e delle esigenze di query.”
Un database vettoriale specializzato è emerso come la soluzione migliore per le esigenze di BOSCH. Dopo aver valutato varie opzioni, BOSCH ha scelto Milvus come soluzione di ricerca vettoriale.
I risultati: riduzione dei costi dell’80% ed efficienza di ricerca ottimizzata
Milvus è un database vettoriale open-source in grado di archiviare, indicizzare e recuperare miliardi di vettori in millisecondi. Anche con i vasti e crescenti volumi di dati di BOSCH, Milvus mantiene prestazioni estremamente elevate. Soprattutto, la tecnologia di indicizzazione per quantizzazione di Milvus riduce in modo significativo il consumo di risorse di archiviazione e computazionali, rendendo più semplice per BOSCH gestire dataset su larga scala.
Riduzione dell’80% dei costi di raccolta dati
Le efficienti capacità di ricerca per similarità di Milvus consentono a BOSCH di recuperare il 70%-80% dei dati di casi limite necessari dai database esistenti, riducendo la necessità di raccogliere nuovi dati. Inoltre, Milvus consente un recupero quasi istantaneo se i dati richiesti sono già nel database, migliorando notevolmente l’efficienza del data mining.
Zhang ha spiegato: “Quando identifichiamo la necessità di dati specifici di casi limite, spesso possiamo trovare i dati richiesti nel nostro database lo stesso giorno utilizzando la ricerca testuale o per immagini con Milvus. Questo migliora notevolmente la nostra efficienza di elaborazione dei dati e ha un effetto positivo sulle nostre operazioni aziendali.”
Riduzione di quasi 1,4 milioni di dollari dei costi annuali di archiviazione
Ridurre la necessità di raccolta dati esterna ha anche abbassato significativamente i costi di archiviazione. Zhang ha aggiunto: “Affidarsi esclusivamente alla raccolta dati esterna potrebbe costare quasi 1,4 milioni di dollari all’anno.”
Efficienza di ricerca ottimizzata
La tecnologia di indicizzazione tramite quantizzazione di Milvus riduce notevolmente il consumo di risorse di archiviazione e di calcolo. BOSCH può ora elaborare i dati in modo più flessibile ed efficiente, superando i limiti di prestazioni dei database tradizionali. Milvus offre anche metodi di ricerca segmentati e partizionati, migliorando l’efficienza e affrontando le attuali sfide legate ai dati su larga scala e ad alta dimensionalità.
Recupero a livello di millisecondi per miliardi di punti dati con un’architettura scalabile
Il business della guida autonoma di BOSCH è basato sul cloud. L’architettura cloud-native di Milvus ne semplifica il deployment e la scalabilità. Offre un’eccellente scalabilità, fondamentale per le operazioni sui dati a livello di miliardi di BOSCH. Quando il suo dataset si espande, al team basta un clic per scalare le risorse necessarie. Zhang ha menzionato: “Anche con numerose ricerche simultanee, non abbiamo notato alcun rallentamento nella velocità di ricerca.”
Supporto attivo della community
Milvus è uno dei database vettoriali open-source più popolari, in rapida evoluzione e maturi, con una vasta e attiva community di utenti e sviluppatori in tutto il mondo. Zhang ha commentato: “La community di Milvus è molto attiva. Ogni volta che abbiamo avuto problemi, abbiamo ricevuto risposte tempestive dalla community.”
Piani futuri: esplorare la capacità di ricerca ibrida di Milvus
Per garantire la diversità dei dati, sono necessarie migliaia di immagini campione. Attualmente, BOSCH dà priorità alle ricerche text-to-image, ricorrendo alle ricerche image-to-image quando i risultati testuali non sono abbastanza buoni. Il supporto di Milvus per colonne multi-vettore e ricerche ibride rende più praticabili le ricerche image-to-image on-demand. Ad esempio, combinare immagini meteorologiche con immagini di coni aiuta a cercare varie condizioni meteorologiche che coinvolgono coni, oppure sovrapporre segnali stradali triangolari con testo descrittivo per cercare diverse funzioni di avviso. Questa è una direzione che BOSCH e Milvus continueranno a esplorare insieme.
Sbloccare il pieno potenziale di Milvus nella guida autonoma
Milvus non è solo uno strumento: è un alleato strategico per BOSCH nell’ambito della guida autonoma. Con Milvus, BOSCH può approfondire l’analisi dei dati e sfruttarne la potenza, ottenendo un vantaggio cruciale nella ricerca di una guida più intelligente e sicura. L’adozione di Milvus ha trasformato il modo in cui BOSCH gestisce i dati, rendendo ogni fase, dalla raccolta all’elaborazione fino all’applicazione, più efficiente e accurata.
Guardando al futuro, BOSCH è impaziente di esplorare ulteriormente le capacità all’avanguardia di Milvus, portando avanti la prossima generazione di esperienze di guida più sicure, intelligenti e comode.
- Informazioni su BOSCH
- La sfida: acquisire dataset di immagini per i corner case
- Esplorare soluzioni di IA: integrazione di LLM e database vettoriali
- Il percorso verso la scelta di Milvus come soluzione per la ricerca di similarità
- I risultati: riduzione dei costi dell’80% ed efficienza di ricerca ottimizzata
- Piani futuri: esplorare la capacità di ricerca ibrida di Milvus
- Sbloccare il pieno potenziale di Milvus nella guida autonoma
Contenuto
Settore
Settore automobilistico
Even with numerous concurrent searches, we didn’t notice any slowdown in search speed with Milvus.
Mr. Zhang


