Wie NAVER Suche und Empfehlungen im großen Maßstab mit Milvus neu erfindet

<20 ms Latenz im großen Maßstab
Unterstützt 5K QPS über 50M+ Entitäten hinweg mit Antwortzeiten unter 20 ms.
Multimodale Suche
Unterstützt Suche und Empfehlungen über Text, Bilder, Video und Audio hinweg.
Hybride Sucharchitektur
Kombiniert Keyword-Präzision mit semantischer Vektorsuche für konversationelle Abfragen.
Enterprise-Zuverlässigkeit
Verteilte Skalierbarkeit und hohe Verfügbarkeit gewährleisten einen stets verfügbaren Dienst.
Among Milvus's rich vector search capabilities, features such as support for multiple ANN index types, multi-vector support, and hybrid search have proven especially valuable in real-world service environments. As Milvus continues to evolve with new capabilities, NAVER expects even broader applications across its services.
NAVER Engineering Team
Über NAVER
NAVER ist Südkoreas führendes Unternehmen für Internetplattformen, mit über der Hälfte des nationalen Suchmarkts und zig Millionen täglichen Nutzern. Sein Ökosystem umfasst Koreas meistgenutzte Suchmaschine, Nachrichten, Blogs, Online-Communities und das weltweit beliebte NAVER Webtoon. Über Inhalte hinaus treibt NAVER den E-Commerce mit NAVER Shopping voran, ermöglicht digitale Zahlungen über Npay und bietet Informationsdienste im Gesundheitswesen.
Im Zentrum des Erfolgs von NAVER stehen fortschrittliche Such- und Empfehlungstechnologien, die eine nahtlose Entdeckung und Interaktion über seine Plattformen hinweg ermöglichen. Da sich die Bedürfnisse der Nutzer von schlüsselwortbasierter Suche hin zu Abfragen in natürlicher Sprache und multimodalen Inhalten verschoben haben, setzt NAVER auf Vektorsuche, um diese neue Ära der Entdeckung zu ermöglichen. Milvus, eine leistungsstarke Open-Source-Vektordatenbank, wird breit über die wichtigsten Dienste von NAVER hinweg eingesetzt, um skalierbare multimodale Suche, Empfehlungen und Zusammenfassungen bereitzustellen.
Die Wachstumsschmerzen der schlüsselwortbasierten Suche
Jahrelang stützte sich die Suchinfrastruktur von NAVER auf textbasiertes Matching mit invertierten Indizes. Obwohl diese Systeme beim exakten Keyword-Matching stark waren, gerieten sie an ihre Grenzen, als Nutzer zunehmend dialogorientiertere Interaktionen in natürlicher Sprache erwarteten. Abfragen wie „Was soll ich tun, wenn mein Kind Fieber hat und nicht essen will?“ oder „bequeme Laufschuhe unter 100 $“ erfordern semantisches Verständnis, das die Keyword-Suche nicht bieten kann.
Auch das Nutzerverhalten verlagerte sich hin zu multimodalen Inhalten wie Bildern, Audio und Videos. Die bestehenden Suchsysteme von NAVER hatten Schwierigkeiten, diese Eingaben zu verarbeiten oder erweiterte Funktionen wie personalisierte Empfehlungen, Zusammenfassungen und kontextbezogene Suche zu unterstützen.
Um diese Herausforderungen zu bewältigen, benötigte NAVER eine neue Vektorsuchlösung, die multimodale und unstrukturierte Daten in massivem Maßstab verarbeiten konnte. Als Marktführer im südkoreanischen Suchmarkt mit einem Anteil von über 50 % benötigte NAVER eine Plattform, die sowohl seiner Größe als auch seiner Verantwortung gerecht wurde. Über die Skalierung hinaus hatten verschiedene NAVER-Dienste unterschiedliche Anforderungen an Entitätsgrößen, Collection-Skalierungen, QPS und Latenz. Jede neue Lösung musste breit über das gesamte Portfolio hinweg funktionieren, mit einheitlicher Verwaltung, Überwachung und flexiblen APIs für die Einführung durch mehrere Teams. Genauer gesagt benötigte NAVER:
Ultraniedrige Latenz: Beispielsweise muss ein Dienst 50 Millionen Entitäten bei 5K QPS durchsuchen, mit Antwortzeiten unter 20 ms.
Verteilte Skalierbarkeit: Fähigkeit, bei Traffic-Spitzen nahtlos zu skalieren, entscheidend für eine Plattform, die mehr als die Hälfte der Suchanfragen in Korea antreibt.
Betriebliche Zuverlässigkeit: Always-on-Dienst mit hoher Verfügbarkeit und starker Fehlertoleranz.
Breite Anwendbarkeit: Flexibilität, um unterschiedliche Anwendungsfälle mit verschiedenen Entitätsgrößen, Collection-Skalierungen, QPS- und Latenzanforderungen abzudecken.
Benutzerfreundlichkeit: Einfache Einführung durch mehrere Serviceteams, mit einheitlicher Verwaltung, Überwachung und flexiblen APIs.
Die Lösung: Transformation der Sucharchitektur mit der Milvus Vector Database
Die Engineering-Teams von NAVER begannen mit einer umfassenden Evaluierung von Vektordatenbanklösungen. Der Bewertungsprozess berücksichtigte mehrere Faktoren, darunter Leistung unter Workloads im Enterprise-Maßstab, Zuverlässigkeits- und Fehlertoleranzfähigkeiten, einfache Integration über unterschiedliche Servicearchitekturen hinweg, Community-Support und langfristige Tragfähigkeit.
Milvus erwies sich aufgrund seiner bewährten Stabilität in Produktionsumgebungen mit hoher Last und seiner umfangreichen Vektorsuchfunktionen als klare Wahl. Die Unterstützung der Datenbank für mehrere ANN-Indextypen, Multi-Vektor-Unterstützung und hybride Suchfunktionalität passte perfekt zu den Anforderungen von NAVER. Darüber hinaus bot Milvus die betrieblichen Vorteile, die NAVER benötigte, einschließlich einheitlicher Verwaltung und Überwachung über Deployments hinweg, flexibler APIs zur Unterstützung vielfältiger Integrationsmuster und einer starken Community, die kontinuierliche Innovation vorantreibt.
Nach der Einführung von Milvus setzte NAVER diese Vektordatenbank in mehreren Diensten ein und schuf damit eine einheitliche Vektorsuchinfrastruktur, die grundlegend veränderte, wie ihre Systeme konversationelle Nutzeranfragen verstehen und darauf reagieren. Anstatt ihre bestehenden keyword-basierten Systeme vollständig zu ersetzen, entwickelten sie einen hybriden Ansatz, der die Präzision der traditionellen Suche mit dem semantischen Verständnis der Vektorsuche kombiniert.
Diese Architektur schuf eine Grundlage, die nicht nur verbesserte Suche, sondern völlig neue Kategorien von Funktionen unterstützen konnte. Funktionen zur Query-Rewriting transformieren Nutzereingaben automatisch in semantisch ähnliche, qualitativ hochwertigere Suchanfragen, die relevantere Ergebnisse liefern. Natural Language Processing ermöglicht es Nutzern, mit konversationeller Sprache zu suchen, anstatt die richtigen Keywords erraten zu müssen. Am wichtigsten ist, dass das System nun Nutzerabsicht und Kontext berücksichtigt, nicht nur wörtliche Textübereinstimmungen.
Geschäftliche Auswirkungen: Von der Suche zur Intelligenz
Mit Milvus ist NAVER über die bloße Verbesserung der Verarbeitung natürlichsprachlicher Anfragen hinausgegangen und ermöglicht nun reichhaltigere, intelligentere Funktionen über mehrere Dienste hinweg. Ein Beispiel ist NAVER’s AI Briefing, das durch die Kombination von Nutzerbewertungen und Blog-Inhalten intelligente Zusammenfassungen bereitstellt. Dies gibt Nutzern umfassende Übersichten über Themen, ohne dass sie mehrere Quellen durchlesen müssen.
In NAVER Healthcare erwies sich die Wirkung als besonders deutlich. Natürlichsprachliche Symptom-Suchen liefern nun medizinisch relevante Ergebnisse auf Basis semantischen Verständnisses statt exakter Keyword-Übereinstimmungen. Dies verbessert die Nutzererfahrung bei gesundheitsbezogenen Anfragen erheblich.
NAVER Shopping erlebte eine vollständige Transformation der Produktentdeckung. Mit Vektorsuche empfiehlt die Plattform nun ähnliche Produkte auf Basis semantischer Ähnlichkeit und nutzt eine Personalisierungs-Engine, die Warenkorbinhalte, Wunschlistenartikel, Kaufhistorie, Suchmuster und sogar Konversationsdaten einbezieht. Dadurch können Nutzer Produkte in natürlicher Sprache beschreiben und trotzdem genau das finden, wonach sie suchen – selbst ohne konkrete Namen oder Kategorien zu kennen. Für NAVER führen diese Fähigkeiten zu relevanteren Empfehlungen, einer reibungsloseren Produktentdeckung und messbaren geschäftlichen Vorteilen, darunter höhere Conversion-Rates, gesteigertes Engagement und längere Verweildauer auf der Plattform.
Die Nachrichtenplattform erweiterte ihr bestehendes Content-Management-System um ausgefeilte Vektorsuchfunktionen. Diese Erweiterung ermöglicht die automatische Erkennung und Entfernung doppelter Artikel durch satzbasierte Ähnlichkeit und reduziert so Redundanzen auf der gesamten Plattform. Sie unterstützt außerdem semantisches Matching für Empfehlungen verwandter Artikel und hilft Nutzern, sich weiterhin mit thematisch relevanten Geschichten zu beschäftigen, selbst wenn exakte Keywords nicht übereinstimmen.
Fazit
Durch die Einführung von Milvus hat NAVER die Grenzen keyword-basierter Suche überwunden, um wirklich semantische und multimodale Erlebnisse zu bieten. Dieser Wandel hat nicht nur die Nutzerzufriedenheit verbessert, sondern auch die Grundlage für völlig neue Service-Möglichkeiten geschaffen.
Weitere NAVER-Teams bauen nun auf dieser Grundlage auf und nutzen Vektorsuche, um Empfehlungen, Zusammenfassungen, Personalisierung und andere fortschrittliche Funktionen zu ermöglichen. Während sich Milvus weiterentwickelt, erwartet dieser Suchmarktführer, dass seine Anwendungsfälle noch weiter zunehmen – und seine Position als führendes Unternehmen im Bereich großskaliger Such- und Empfehlungssysteme stärken.
Mit Blick auf die Zukunft verfolgt NAVER die Vision, ein nahtloses Entdeckungsökosystem über alle seine Plattformen hinweg zu schaffen – in dem Suche, Empfehlungen und Inhalte personalisiert und intuitiv wirken. Mit Milvus als skalierbarer Grundlage kann NAVER schneller innovieren, den Nutzern größeren Mehrwert bieten und die Zukunft intelligenter Informationsdienste weiterhin mitgestalten.


