Como a NAVER reinventa a busca e as recomendações em escala com o Milvus

Latência de <20ms em escala
Suporta 5K QPS em mais de 50M de entidades com tempos de resposta abaixo de 20 ms.
Busca Multimodal
Impulsiona a busca e as recomendações em texto, imagens, vídeo e áudio.
Arquitetura de Busca Híbrida
Combina a precisão de palavras-chave com a busca vetorial semântica para consultas conversacionais.
Confiabilidade Empresarial
Escalabilidade distribuída e alta disponibilidade garantem um serviço sempre ativo.
Among Milvus's rich vector search capabilities, features such as support for multiple ANN index types, multi-vector support, and hybrid search have proven especially valuable in real-world service environments. As Milvus continues to evolve with new capabilities, NAVER expects even broader applications across its services.
NAVER Engineering Team
Sobre a NAVER
A NAVER é a principal empresa de plataforma de internet da Coreia do Sul, com mais da metade do mercado de buscas do país e dezenas de milhões de usuários diários. Seu ecossistema abrange o mecanismo de busca mais usado da Coreia, notícias, blogs, comunidades online e o NAVER Webtoon, popular globalmente. Além de conteúdo, a NAVER impulsiona o e-commerce com o NAVER Shopping, viabiliza pagamentos digitais por meio do Npay e oferece serviços de informação em saúde.
No centro do sucesso da NAVER estão tecnologias avançadas de busca e recomendação que permitem descoberta e engajamento contínuos em suas plataformas. À medida que as necessidades dos usuários passaram da busca baseada em palavras-chave para consultas em linguagem natural e conteúdo multimodal, a NAVER recorreu à busca vetorial para impulsionar esta nova era de descoberta. O Milvus, um banco de dados vetorial open-source de alto desempenho, é amplamente implantado nos principais serviços da NAVER para oferecer busca multimodal escalável, recomendações e sumarização.
As Dores de Crescimento da Busca Baseada em Palavras-chave
Durante anos, a infraestrutura de busca da NAVER dependeu de correspondência de texto baseada em índices invertidos. Embora fortes na correspondência exata de palavras-chave, esses sistemas enfrentaram dificuldades à medida que os usuários passaram a esperar interações mais conversacionais, em linguagem natural. Consultas como “O que devo fazer se meu filho está com febre e não quer comer?” ou “tênis de corrida confortáveis por menos de $100” exigem compreensão semântica, algo que a busca por palavras-chave não consegue oferecer.
O comportamento dos usuários também estava mudando em direção a conteúdo multimodal, como imagens, áudio e vídeos. Os sistemas de busca existentes da NAVER tinham dificuldade para lidar com essas entradas ou dar suporte a recursos avançados, como recomendações personalizadas, sumarização e busca contextual.
Para enfrentar esses desafios, a NAVER precisava de uma nova solução de busca vetorial capaz de lidar com dados multimodais e não estruturados em escala massiva. Como líder do mercado de buscas da Coreia do Sul, com mais de 50% de participação, a NAVER precisava de uma plataforma que correspondesse tanto à sua escala quanto à sua responsabilidade. Além da escala, diferentes serviços da NAVER tinham requisitos variados para tamanhos de entidades, escalas de coleções, QPS e latência. Qualquer nova solução precisava funcionar amplamente em todo o portfólio, com gerenciamento unificado, monitoramento e APIs flexíveis para adoção por várias equipes. Mais especificamente, a NAVER exigia:
Latência Ultrabaixa: por exemplo, um serviço precisa pesquisar em 50 milhões de entidades a 5K QPS, com tempos de resposta abaixo de 20ms.
Escalabilidade Distribuída: Capacidade de escalar de forma contínua durante picos de tráfego, fundamental para uma plataforma que alimenta mais da metade das buscas da Coreia.
Confiabilidade Operacional: Serviço sempre ativo com alta disponibilidade e forte tolerância a falhas.
Ampla Aplicabilidade: Flexibilidade para cobrir diversos casos de uso com diferentes tamanhos de entidades, escalas de coleções, QPS e requisitos de latência.
Usabilidade: Fácil adoção por várias equipes de serviço, com gerenciamento unificado, monitoramento e APIs flexíveis.
A Solução: Transformando a Arquitetura de Busca com o Banco de Dados Vetorial Milvus
As equipes de engenharia da NAVER iniciaram uma avaliação extensiva de soluções de banco de dados vetorial. O processo de avaliação considerou múltiplos fatores, incluindo desempenho sob cargas de trabalho em escala empresarial, capacidades de confiabilidade e tolerância a falhas, facilidade de integração em diversas arquiteturas de serviço, suporte da comunidade e viabilidade de longo prazo.
O Milvus surgiu como a escolha clara devido à sua estabilidade comprovada em ambientes de produção de alta carga e aos seus ricos recursos de busca vetorial. O suporte do banco de dados a múltiplos tipos de índice ANN, suporte a múltiplos vetores e funcionalidade de busca híbrida alinhou-se perfeitamente aos requisitos da NAVER. Além disso, o Milvus ofereceu as vantagens operacionais de que a NAVER precisava, incluindo gerenciamento e monitoramento unificados em implantações, APIs flexíveis que dão suporte a diversos padrões de integração e uma comunidade forte apoiando a inovação contínua.
Depois de adotar o Milvus, a NAVER implantou esse banco de dados vetorial em vários serviços, criando uma infraestrutura unificada de busca vetorial que mudou fundamentalmente a forma como seus sistemas entendem e respondem a consultas conversacionais dos usuários. Em vez de substituir completamente seus sistemas existentes baseados em palavras-chave, eles criaram uma abordagem híbrida que combina a precisão da busca tradicional com a compreensão semântica da busca vetorial.
Essa arquitetura criou uma base capaz de sustentar não apenas uma busca aprimorada, mas categorias totalmente novas de recursos. Os recursos de reescrita de consultas transformam automaticamente as entradas dos usuários em buscas semanticamente semelhantes e de maior qualidade, que retornam resultados mais relevantes. O processamento de linguagem natural permite que os usuários pesquisem usando linguagem conversacional, em vez de terem que adivinhar as palavras-chave corretas. Mais importante ainda, o sistema agora considera a intenção e o contexto do usuário, não apenas correspondências literais de texto.
Impacto nos negócios: Da busca à inteligência
Com o Milvus, a NAVER foi além de simplesmente melhorar o tratamento de consultas em linguagem natural, permitindo recursos mais ricos e inteligentes em vários serviços. Um exemplo é o AI Briefing da NAVER, que fornece sumarização inteligente ao combinar avaliações de usuários e conteúdo de blogs. Isso oferece aos usuários visões gerais abrangentes sobre tópicos sem exigir que eles leiam várias fontes.
Na NAVER Healthcare, o impacto se mostrou particularmente significativo. As buscas por sintomas em linguagem natural agora retornam resultados clinicamente relevantes com base na compreensão semântica, em vez de correspondências exatas de palavras-chave. Isso melhora drasticamente a experiência do usuário em consultas relacionadas à saúde.
A NAVER Shopping passou por uma transformação completa na descoberta de produtos. Com a busca vetorial, a plataforma agora recomenda produtos semelhantes com base na similaridade semântica e aproveita um mecanismo de personalização que incorpora conteúdos do carrinho, itens da lista de desejos, histórico de compras, padrões de busca e até dados de conversas. Isso permite que os usuários descrevam produtos em linguagem natural e ainda encontrem exatamente o que procuram — mesmo sem saber nomes ou categorias específicos. Para a NAVER, esses recursos se traduzem em recomendações mais relevantes, descoberta de produtos mais fluida e benefícios comerciais mensuráveis, incluindo taxas de conversão mais altas, maior engajamento e mais tempo gasto na plataforma.
A plataforma de notícias ampliou seu sistema de gerenciamento de conteúdo existente com recursos sofisticados de busca vetorial. Esse aprimoramento permite a detecção e remoção automáticas de artigos duplicados por meio de similaridade em nível de frase, reduzindo a redundância em toda a plataforma. Ele também impulsiona a correspondência semântica para recomendações de artigos relacionados, ajudando os usuários a permanecerem engajados com histórias tematicamente relevantes mesmo quando as palavras-chave exatas não coincidem.
Conclusão
Ao adotar o Milvus, a NAVER superou as limitações da busca baseada em palavras-chave para oferecer experiências verdadeiramente semânticas e multimodais. Essa mudança não apenas melhorou a satisfação dos usuários, mas também estabeleceu as bases para oportunidades de serviço totalmente novas.
Mais equipes da NAVER agora estão construindo sobre essa base, aplicando a busca vetorial para impulsionar recomendações, sumarização, personalização e outros recursos avançados. À medida que o Milvus continua a evoluir, essa líder em buscas espera que seus casos de uso se expandam ainda mais — fortalecendo sua posição como líder em sistemas de busca e recomendação em larga escala.
Olhando para o futuro, a visão da NAVER é criar um ecossistema de descoberta contínuo em todas as suas plataformas — no qual busca, recomendações e conteúdo pareçam personalizados e intuitivos. Com o Milvus como uma base escalável, a NAVER pode inovar mais rapidamente, entregar maior valor aos usuários e continuar a moldar o futuro dos serviços inteligentes de informação.


