Come NAVER reinventa la ricerca e le raccomandazioni su larga scala con Milvus

Latenza <20ms su larga scala
Supporta 5K QPS su oltre 50 milioni di entità con tempi di risposta inferiori a 20 ms.
Ricerca multimodale
Alimenta la ricerca e i consigli su testo, immagini, video e audio.
Architettura di ricerca ibrida
Combina la precisione delle parole chiave con la ricerca vettoriale semantica per le query conversazionali.
Affidabilità aziendale
La scalabilità distribuita e l’alta disponibilità garantiscono un servizio sempre attivo.
Among Milvus's rich vector search capabilities, features such as support for multiple ANN index types, multi-vector support, and hybrid search have proven especially valuable in real-world service environments. As Milvus continues to evolve with new capabilities, NAVER expects even broader applications across its services.
NAVER Engineering Team
Informazioni su NAVER
NAVER è la principale azienda sudcoreana di piattaforme internet, con oltre la metà del mercato nazionale della ricerca e decine di milioni di utenti giornalieri. Il suo ecosistema comprende il motore di ricerca più utilizzato in Corea, notizie, blog, community online e il popolarissimo NAVER Webtoon a livello globale. Oltre ai contenuti, NAVER promuove l’e-commerce con NAVER Shopping, alimenta i pagamenti digitali tramite Npay e offre servizi di informazione sanitaria.
Al centro del successo di NAVER ci sono tecnologie avanzate di ricerca e raccomandazione che consentono una scoperta e un coinvolgimento fluidi sulle sue piattaforme. Poiché le esigenze degli utenti sono passate dalla ricerca basata su parole chiave alle query in linguaggio naturale e ai contenuti multimodali, NAVER si è rivolta alla ricerca vettoriale per alimentare questa nuova era della scoperta. Milvus, un database vettoriale open-source ad alte prestazioni, è ampiamente distribuito nei principali servizi di NAVER per offrire ricerca multimodale scalabile, raccomandazioni e riepilogo.
Le difficoltà crescenti della ricerca basata su parole chiave
Per anni, l’infrastruttura di ricerca di NAVER si è basata sulla corrispondenza testuale tramite indici invertiti. Pur essendo efficaci nella corrispondenza esatta delle parole chiave, questi sistemi hanno iniziato a mostrare limiti quando gli utenti hanno cominciato ad aspettarsi interazioni più conversazionali e in linguaggio naturale. Query come “Cosa dovrei fare se mio figlio ha la febbre e non vuole mangiare?” o “scarpe da running comode sotto i $100” richiedono una comprensione semantica che la ricerca per parole chiave non può fornire.
Anche il comportamento degli utenti si stava spostando verso contenuti multimodali come immagini, audio e video. I sistemi di ricerca esistenti di NAVER faticavano a gestire questi input o a supportare funzionalità avanzate come raccomandazioni personalizzate, riepilogo e ricerca contestuale.
Per affrontare queste sfide, NAVER aveva bisogno di una nuova soluzione di ricerca vettoriale in grado di gestire dati multimodali e non strutturati su scala massiva. In qualità di leader del mercato della ricerca in Corea del Sud con una quota superiore al 50%, NAVER richiedeva una piattaforma all’altezza sia della sua scala sia della sua responsabilità. Oltre alla scala, i diversi servizi NAVER avevano requisiti variabili in termini di dimensioni delle entità, scale delle collection, QPS e latenza. Qualsiasi nuova soluzione doveva funzionare ampiamente in tutto il portfolio, con gestione unificata, monitoraggio e API flessibili per l’adozione da parte di più team. Più nello specifico, NAVER richiedeva:
Latenza ultra bassa: ad esempio, un servizio deve effettuare ricerche su 50 milioni di entità a 5K QPS, con tempi di risposta inferiori a 20ms.
Scalabilità distribuita: capacità di scalare senza interruzioni durante i picchi di traffico, fondamentale per una piattaforma che alimenta più della metà delle ricerche in Corea.
Affidabilità operativa: servizio always-on con alta disponibilità e forte tolleranza ai guasti.
Ampia applicabilità: flessibilità per coprire diversi casi d’uso con differenti dimensioni delle entità, scale delle collection, QPS e requisiti di latenza.
Usabilità: facile adozione da parte di più team di servizio, con gestione unificata, monitoraggio e API flessibili.
La soluzione: trasformare l’architettura di ricerca con il database vettoriale Milvus
I team di engineering di NAVER hanno intrapreso un’ampia valutazione delle soluzioni di database vettoriali. Il processo di valutazione ha considerato molteplici fattori, tra cui le prestazioni con carichi di lavoro su scala enterprise, le capacità di affidabilità e tolleranza ai guasti, la facilità di integrazione tra diverse architetture di servizio, il supporto della community e la sostenibilità a lungo termine.
Milvus è emerso come la scelta evidente grazie alla sua stabilità comprovata in ambienti di produzione ad alto carico e alle sue ricche funzionalità di ricerca vettoriale. Il supporto del database per molteplici tipi di indici ANN, il supporto multi-vettore e la funzionalità di ricerca ibrida si allineavano perfettamente ai requisiti di NAVER. Inoltre, Milvus offriva i vantaggi operativi di cui NAVER aveva bisogno, tra cui gestione e monitoraggio unificati tra le distribuzioni, API flessibili a supporto di diversi modelli di integrazione e una solida community a sostegno dell’innovazione continua.
Dopo aver adottato Milvus, NAVER ha distribuito questo database vettoriale su più servizi, creando un’infrastruttura unificata di ricerca vettoriale che ha cambiato radicalmente il modo in cui i loro sistemi comprendono e rispondono alle query conversazionali degli utenti. Invece di sostituire completamente i loro sistemi esistenti basati su parole chiave, hanno creato un approccio ibrido che combina la precisione della ricerca tradizionale con la comprensione semantica della ricerca vettoriale.
Questa architettura ha creato una base in grado di supportare non solo una ricerca migliorata, ma categorie di funzionalità completamente nuove. Le capacità di riscrittura delle query trasformano automaticamente gli input degli utenti in ricerche semanticamente simili e di qualità superiore, che restituiscono risultati più pertinenti. L’elaborazione del linguaggio naturale consente agli utenti di cercare utilizzando un linguaggio conversazionale invece di dover indovinare le parole chiave giuste. Ancora più importante, il sistema ora considera l’intento e il contesto dell’utente, non solo le corrispondenze letterali del testo.
Impatto aziendale: dalla ricerca all’intelligenza
Con Milvus, NAVER è andata oltre il semplice miglioramento della gestione delle query in linguaggio naturale, abilitando funzionalità più ricche e intelligenti su più servizi. Un esempio è AI Briefing di NAVER, che fornisce una sintesi intelligente combinando recensioni degli utenti e contenuti dei blog. Questo offre agli utenti panoramiche complete degli argomenti senza richiedere loro di leggere più fonti.
In NAVER Healthcare, l’impatto si è rivelato particolarmente significativo. Le ricerche di sintomi in linguaggio naturale ora restituiscono risultati medicalmente rilevanti basati sulla comprensione semantica anziché su corrispondenze esatte di parole chiave. Questo migliora notevolmente l’esperienza utente per le query relative alla salute.
NAVER Shopping ha vissuto una trasformazione completa nella scoperta dei prodotti. Con la ricerca vettoriale, la piattaforma ora consiglia prodotti simili in base alla similarità semantica e sfrutta un motore di personalizzazione che incorpora contenuti del carrello, articoli nella lista dei desideri, cronologia degli acquisti, pattern di ricerca e persino dati conversazionali. Questo consente agli utenti di descrivere i prodotti in linguaggio naturale e trovare comunque esattamente ciò che stanno cercando, anche senza conoscere nomi o categorie specifici. Per NAVER, queste capacità si traducono in raccomandazioni più pertinenti, una scoperta dei prodotti più fluida e benefici aziendali misurabili, tra cui tassi di conversione più elevati, maggiore coinvolgimento e più tempo trascorso sulla piattaforma.
La piattaforma di notizie ha esteso il proprio sistema di gestione dei contenuti esistente con sofisticate capacità di ricerca vettoriale. Questo miglioramento consente il rilevamento e la rimozione automatici di articoli duplicati tramite similarità a livello di frase, riducendo la ridondanza sulla piattaforma. Alimenta inoltre il matching semantico per le raccomandazioni di articoli correlati, aiutando gli utenti a rimanere coinvolti con storie tematicamente rilevanti anche quando le parole chiave esatte non coincidono.
Conclusione
Adottando Milvus, NAVER ha superato i limiti della ricerca basata su parole chiave per offrire esperienze realmente semantiche e multimodali. Questo cambiamento non solo ha migliorato la soddisfazione degli utenti, ma ha anche gettato le basi per opportunità di servizio completamente nuove.
Sempre più team di NAVER stanno ora costruendo su questa base, applicando la ricerca vettoriale per alimentare raccomandazioni, sintesi, personalizzazione e altre funzionalità avanzate. Man mano che Milvus continua a evolversi, questo leader della ricerca si aspetta che i suoi casi d’uso si espandano ancora di più, rafforzando la sua posizione di leader nei sistemi di ricerca e raccomandazione su larga scala.
Guardando al futuro, la visione di NAVER è creare un ecosistema di scoperta fluido su tutte le sue piattaforme, in cui ricerca, raccomandazioni e contenuti risultino personalizzati e intuitivi. Con Milvus come base scalabile, NAVER può innovare più rapidamente, offrire maggior valore agli utenti e continuare a plasmare il futuro dei servizi informativi intelligenti.


