Cómo NAVER reinventa la búsqueda y las recomendaciones a escala con Milvus

<20ms de latencia a escala
Admite 5K QPS en más de 50M de entidades con tiempos de respuesta inferiores a 20 ms.
Búsqueda multimodal
Impulsa la búsqueda y las recomendaciones en texto, imágenes, video y audio.
Arquitectura de búsqueda híbrida
Combina la precisión de las palabras clave con la búsqueda vectorial semántica para consultas conversacionales.
Confiabilidad empresarial
La escalabilidad distribuida y la alta disponibilidad garantizan un servicio siempre activo.
Among Milvus's rich vector search capabilities, features such as support for multiple ANN index types, multi-vector support, and hybrid search have proven especially valuable in real-world service environments. As Milvus continues to evolve with new capabilities, NAVER expects even broader applications across its services.
NAVER Engineering Team
Acerca de NAVER
NAVER es la empresa líder de plataformas de internet de Corea del Sur, con más de la mitad del mercado de búsquedas del país y decenas de millones de usuarios diarios. Su ecosistema abarca el motor de búsqueda más utilizado de Corea, noticias, blogs, comunidades en línea y el mundialmente popular NAVER Webtoon. Más allá del contenido, NAVER impulsa el comercio electrónico con NAVER Shopping, potencia los pagos digitales a través de Npay y ofrece servicios de información sanitaria.
En el núcleo del éxito de NAVER se encuentran tecnologías avanzadas de búsqueda y recomendación que permiten un descubrimiento y una interacción fluidos en todas sus plataformas. A medida que las necesidades de los usuarios han pasado de la búsqueda basada en palabras clave a consultas en lenguaje natural y contenido multimodal, NAVER ha recurrido a la búsqueda vectorial para impulsar esta nueva era del descubrimiento. Milvus, una base de datos vectorial de código abierto de alto rendimiento, está ampliamente implementada en los principales servicios de NAVER para ofrecer búsqueda multimodal escalable, recomendaciones y resumen.
Los dolores de crecimiento de la búsqueda basada en palabras clave
Durante años, la infraestructura de búsqueda de NAVER se basó en la coincidencia de texto mediante índices invertidos. Aunque estos sistemas eran sólidos en la coincidencia exacta de palabras clave, empezaron a tener dificultades a medida que los usuarios comenzaron a esperar interacciones más conversacionales y en lenguaje natural. Consultas como “¿Qué debo hacer si mi hijo tiene fiebre y no quiere comer?” o “zapatillas cómodas para correr por menos de $100” requieren comprensión semántica, algo que la búsqueda por palabras clave no puede proporcionar.
El comportamiento de los usuarios también estaba cambiando hacia contenido multimodal como imágenes, audio y videos. Los sistemas de búsqueda existentes de NAVER tenían dificultades para manejar estas entradas o admitir funciones avanzadas como recomendaciones personalizadas, resumen y búsqueda contextual.
Para abordar estos desafíos, NAVER necesitaba una nueva solución de búsqueda vectorial que pudiera manejar datos multimodales y no estructurados a una escala masiva. Como líder del mercado de búsquedas de Corea del Sur con más del 50% de participación, NAVER requería una plataforma que estuviera a la altura tanto de su escala como de su responsabilidad. Más allá de la escala, los diferentes servicios de NAVER tenían requisitos variables en cuanto a tamaños de entidades, escalas de colecciones, QPS y latencia. Cualquier nueva solución debía funcionar ampliamente en todo el portafolio, con gestión unificada, monitoreo y APIs flexibles para su adopción por múltiples equipos. Más específicamente, NAVER requería:
Latencia ultrabaja: por ejemplo, un servicio debe buscar entre 50 millones de entidades a 5K QPS, con tiempos de respuesta inferiores a 20ms.
Escalabilidad distribuida: Capacidad para escalar sin problemas durante picos de tráfico, fundamental para una plataforma que impulsa más de la mitad de las búsquedas de Corea.
Fiabilidad operativa: Servicio siempre activo con alta disponibilidad y fuerte tolerancia a fallos.
Amplia aplicabilidad: Flexibilidad para cubrir diversos casos de uso con diferentes tamaños de entidades, escalas de colecciones, QPS y requisitos de latencia.
Usabilidad: Fácil adopción por múltiples equipos de servicio, con gestión unificada, monitoreo y APIs flexibles.
La solución: transformar la arquitectura de búsqueda con la base de datos vectorial Milvus
Los equipos de ingeniería de NAVER emprendieron una evaluación exhaustiva de soluciones de bases de datos vectoriales. El proceso de evaluación consideró múltiples factores, incluido el rendimiento bajo cargas de trabajo a escala empresarial, las capacidades de fiabilidad y tolerancia a fallos, la facilidad de integración en diversas arquitecturas de servicios, el apoyo de la comunidad y la viabilidad a largo plazo.
Milvus surgió como la opción clara debido a su estabilidad comprobada en entornos de producción de alta carga y sus ricas capacidades de búsqueda vectorial. El soporte de la base de datos para múltiples tipos de índices ANN, soporte multivectorial y funcionalidad de búsqueda híbrida se alineó perfectamente con los requisitos de NAVER. Además, Milvus ofrecía las ventajas operativas que NAVER necesitaba, incluida la gestión y el monitoreo unificados en todas las implementaciones, APIs flexibles que admiten diversos patrones de integración y una comunidad sólida que respalda la innovación continua.
Tras adoptar Milvus, NAVER implementó esta base de datos vectorial en múltiples servicios, creando una infraestructura unificada de búsqueda vectorial que cambió fundamentalmente la forma en que sus sistemas comprenden y responden a las consultas conversacionales de los usuarios. En lugar de reemplazar por completo sus sistemas existentes basados en palabras clave, crearon un enfoque híbrido que combina la precisión de la búsqueda tradicional con la comprensión semántica de la búsqueda vectorial.
Esta arquitectura creó una base que podía respaldar no solo una búsqueda mejorada, sino categorías completamente nuevas de funcionalidades. Las capacidades de reescritura de consultas transforman automáticamente las entradas de los usuarios en búsquedas semánticamente similares y de mayor calidad que devuelven resultados más relevantes. El procesamiento del lenguaje natural permite a los usuarios buscar utilizando lenguaje conversacional en lugar de tener que adivinar las palabras clave correctas. Lo más importante es que el sistema ahora considera la intención y el contexto del usuario, no solo coincidencias literales de texto.
Impacto empresarial: de la búsqueda a la inteligencia
Con Milvus, NAVER ha ido más allá de simplemente mejorar el manejo de consultas en lenguaje natural para habilitar funcionalidades más ricas e inteligentes en múltiples servicios. Un ejemplo es AI Briefing de NAVER, que proporciona resumen inteligente combinando reseñas de usuarios y contenido de blogs. Esto ofrece a los usuarios panoramas completos de los temas sin exigirles leer múltiples fuentes.
En NAVER Healthcare, el impacto resultó particularmente dramático. Las búsquedas de síntomas en lenguaje natural ahora devuelven resultados médicamente relevantes basados en la comprensión semántica en lugar de coincidencias exactas de palabras clave. Esto mejora drásticamente la experiencia del usuario para consultas relacionadas con la salud.
NAVER Shopping experimentó una transformación completa en el descubrimiento de productos. Con la búsqueda vectorial, la plataforma ahora recomienda productos similares en función de la similitud semántica y aprovecha un motor de personalización que incorpora el contenido del carrito, artículos de la lista de deseos, historial de compras, patrones de búsqueda e incluso datos de conversaciones. Esto permite a los usuarios describir productos en lenguaje natural y aun así encontrar exactamente lo que buscan, incluso sin conocer nombres o categorías específicos. Para NAVER, estas capacidades se traducen en recomendaciones más relevantes, un descubrimiento de productos más fluido y beneficios empresariales medibles, incluidos mayores índices de conversión, mayor interacción y más tiempo de permanencia en la plataforma.
La plataforma de noticias amplió su sistema existente de gestión de contenidos con capacidades sofisticadas de búsqueda vectorial. Esta mejora permite la detección y eliminación automáticas de artículos duplicados mediante similitud a nivel de oración, reduciendo la redundancia en toda la plataforma. También impulsa la coincidencia semántica para recomendaciones de artículos relacionados, ayudando a los usuarios a mantenerse involucrados con historias temáticamente relevantes incluso cuando las palabras clave exactas no coinciden.
Conclusión
Al adoptar Milvus, NAVER ha superado las limitaciones de la búsqueda basada en palabras clave para ofrecer experiencias verdaderamente semánticas y multimodales. Este cambio no solo ha mejorado la satisfacción del usuario, sino que también ha sentado las bases para oportunidades de servicio completamente nuevas.
Más equipos de NAVER están construyendo ahora sobre esta base, aplicando la búsqueda vectorial para impulsar recomendaciones, resúmenes, personalización y otras funcionalidades avanzadas. A medida que Milvus continúa evolucionando, este líder en búsqueda espera que sus casos de uso se expandan aún más, fortaleciendo su posición como líder en sistemas de búsqueda y recomendación a gran escala.
De cara al futuro, la visión de NAVER es crear un ecosistema de descubrimiento fluido en todas sus plataformas, donde la búsqueda, las recomendaciones y el contenido se sientan personalizados e intuitivos. Con Milvus como base escalable, NAVER puede innovar más rápidamente, ofrecer mayor valor a los usuarios y seguir moldeando el futuro de los servicios inteligentes de información.


