Exa cria mecanismo de busca de entidades para agentes de IA com Zilliz Cloud

<200ms de latência de busca
Latência da busca neural da Exa reduzida de segundos para menos de 200 ms com a busca híbrida da Zilliz
Alta confiabilidade
Incidentes operacionais quase nulos, liberando tempo de engenharia para o trabalho no produto
Tempo de inatividade zero para alterações de esquema
Novos campos filtráveis e metadados podem ser adicionados sem reconstruir índices ou colocar coleções offline
We believe AI agents will become a fundamental interface for how people work, learn, and make decisions, and that only happens if those systems can access real-world information with speed, precision, and trust. That’s what we’re building at Exa. Aside from web search, Exa also operates entity search, and Zilliz Cloud has been an important part of that journey, giving us the retrieval performance and operational simplicity we need to scale our entity search product quickly and confidently.
Jeffrey Wang
Busca para agentes de IA soa como uma extensão natural da busca na web, mas, na prática, exige um padrão de produto diferente. Agentes não precisam apenas de links; eles precisam de informações fundamentadas, atuais e estruturadas, entregues com rapidez suficiente para dar suporte a fluxos de trabalho reais, desde interações por voz até tarefas de pesquisa aprofundada.
Exa está construindo exatamente esse tipo de mecanismo de busca para IA. Sua Search API dá aos desenvolvedores acesso a uma busca na web de alta qualidade e baixa latência em uma ampla faixa de computação-latência, desde busca instantânea para agentes de voz até pesquisas mais aprofundadas com saídas estruturadas e enriquecimentos. A Exa atende clientes que vão de startups nativas de IA, como Cursor e Lovable, a empresas corporativas como AWS, todas as quais dependem de contexto fundamentado e do mundo real para fluxos de trabalho orientados por agentes.
À medida que a Exa se expande para a busca de entidades de empresas, pessoas e código, ela enfrentou um desafio de infraestrutura mais especializado: como dar suporte à recuperação híbrida, filtragem rica de metadados, atualizações frequentes e latência em nível de milissegundos sem desviar o foco da engenharia do mecanismo de busca principal. Esse é o papel específico que Zilliz Cloud (Milvus totalmente gerenciado) desempenha na história abaixo.
| Baixa latência de busca de 200ms | Busca híbrida combinando vetores densos, vetores esparsos, reranqueamento RRF e filtros de metadados em uma única chamada de API. Exa Instant reduziu a latência da busca neural de segundos para menos de 200ms |
| Alta confiabilidade | O serviço gerenciado entregou incidentes operacionais quase zero, liberando tempo de engenharia para trabalho de produto |
| Zero Downtime para mudanças de esquema | Novos campos filtráveis e metadados podem ser adicionados sem reconstruir índices ou tirar coleções do ar |
Abaixo está o roteiro de uma conversa com a Exa sobre sua missão de produto, a mudança de busca geral na web para busca de entidades e como o Zilliz Cloud se encaixa nessa evolução.
1. A promessa de produto da Exa: busca fundamentada para agentes de IA
Começamos pedindo à Exa que descrevesse o produto que está construindo e os clientes que atende, porque esse contexto explica por que a qualidade e a latência da recuperação não são preocupações secundárias para a empresa.
Q: Que produto ou serviço a Exa oferece, e quem são seus principais clientes?
Exa: A Exa está construindo o mecanismo de busca para IA. Construímos uma API de busca que permite aos desenvolvedores acessar buscas na web de alta qualidade e baixa latência em seus agentes. Nossa API oferece busca em todo o espectro de latência computacional, de buscas instantâneas (<200ms) para agentes de voz a pesquisa aprofundada com saídas estruturadas e enriquecimentos. Somos especializados em busca de código, baixa latência e busca de pessoas/empresas, com destaques que garantem eficiência de tokens.
Construímos nosso mecanismo de busca do zero usando novas arquiteturas neurais, em vez de depender de mecanismos de busca legados. Construir seu próprio mecanismo de busca exige tudo, desde treinar modelos de embedding e rerankers até rastrear e indexar bilhões de páginas da web. Essa propriedade de ponta a ponta nos permite otimizar cada camada da stack para qualidade e velocidade. No lançamento recente do Exa Instant, por exemplo, alcançamos latência de busca <200ms — uma melhoria significativa que torna a busca neural viável como um primitivo em tempo real para agentes de IA. A combinação de qualidade, velocidade e personalização é um diferencial fundamental.
Nossos clientes vão de empresas nativas de IA como Cursor e Lovable a grandes corporações. Qualquer empresa que use agentes para impulsionar trabalho do conhecimento precisa de contexto fundamentado para responder ao mundo real, portanto, independentemente do tamanho da empresa, trabalhamos com equipes que priorizam fluxos de trabalho orientados por agentes.
2. O ponto de inflexão: de busca na web para busca de entidades
Esse contexto de produto também esclarece por que a decisão de banco de dados da Exa não se tratava de substituir sua stack de busca principal. A busca vetorial já era fundamental para a empresa. A mudança real veio quando a busca de entidades introduziu novas restrições.
P: Em que ponto da jornada do seu produto vocês perceberam que precisavam de um banco de dados vetorial?
Exa: Dado que nosso mecanismo de busca foi construído com embeddings e similaridade vetorial, a busca vetorial tem sido uma parte integral da stack tecnológica da Exa. À medida que nos expandimos para a busca de entidades, precisamos atualizar nossa infraestrutura de banco de dados vetorial para acomodar os resultados estruturados e os enriquecimentos que agora oferecíamos.
A busca de entidades exige esquemas de metadados ricos, atualizações frequentes de dados e escalabilidade gerenciada. Nosso banco de dados interno foi otimizado para essas restrições atualizadas, mas queríamos melhorar ainda mais a velocidade de iteração em toda essa camada de busca de entidades, o que nos levou a usar o Zilliz Cloud. Nosso índice web principal permanece em nossa infraestrutura interna, e o Zilliz Cloud foi incorporado especificamente para impulsionar essa camada de busca de entidades.
P: Quais desafios ou requisitos vocês enfrentaram com a solução anterior?
Exa: Quando começamos a construir a busca de entidades, os requisitos eram muito diferentes: busca híbrida combinando vetores densos e esparsos, esquemas de metadados ricos e que mudam com frequência, e a sobrecarga operacional de gerenciar várias coleções especializadas. Estávamos procurando uma solução gerenciada que permitisse aos nossos engenheiros iterar rapidamente e oferecer suporte a respostas rápidas em escala.
P: Que caso(s) de uso específico(s) vocês estão resolvendo com busca vetorial/banco de dados vetorial?
Exa: Hoje, o Zilliz Cloud impulsiona nossa camada de busca de entidades, servindo tanto como índice primário quanto como cache de recência em coleções de entidades, enquanto nosso índice web principal roda em uma infraestrutura interna separada. Cada vertical exige busca filtrada de baixa latência sobre dados atualizados com frequência, em que os recursos gerenciados de recuperação híbrida e hot-upsert da Zilliz mantêm os resultados atualizados sem reconstruir índices. Essas verticais alimentam diretamente nossa Search API, portanto velocidade e recall são críticos para o negócio.
3. O que a Exa precisava de uma camada gerenciada de recuperação vetorial
Depois que a busca de entidades se tornou uma camada distinta, a avaliação foi realmente sobre adequação: um sistema gerenciado conseguiria sustentar o padrão de qualidade de busca da Exa sem desacelerar a equipe ou forçar compromissos arquiteturais?
P: Quais bancos de dados vetoriais vocês avaliaram antes de escolher o Zilliz Cloud? Quais foram os principais critérios na sua avaliação?
Exa: Quando começamos a construir a busca de entidades, os requisitos eram muito diferentes: busca híbrida combinando vetores densos e esparsos, esquemas de metadados ricos e que mudam com frequência, e a sobrecarga operacional de gerenciar várias coleções especializadas. Estávamos procurando uma solução gerenciada que permitisse aos nossos engenheiros iterar rapidamente e oferecer suporte a respostas rápidas em escala.
Pesquisamos todas as principais opções de bancos de dados vetoriais do mercado. Nossos principais critérios foram:
Suporte a busca híbrida: Capacidade nativa de combinar vetores semânticos densos com vetores esparsos de palavras-chave em uma única consulta, com reranking integrado
Latência de consulta: Respostas consistentemente rápidas em coleções com dezenas de milhões de vetores
Filtragem rica de metadados: Filtros complexos em campos estruturados sem degradar o desempenho da busca
Escalabilidade: Escalonamento contínuo à medida que adicionamos novas verticais e fontes de dados
O Zilliz Cloud atendeu a todos os requisitos, e seu desempenho em benchmarks de busca híbrida estava claramente à frente dos demais.
P: Como vocês ouviram falar pela primeira vez do Zilliz Cloud / Milvus?
Exa: Já conhecemos o Milvus há muito tempo, pois é um dos bancos de dados vetoriais open-source mais maduros, e, como uma equipe que vive e respira busca vetorial, é difícil não conhecê-lo. Quando começamos a definir o escopo da nossa infraestrutura de busca de entidades, o Zilliz Cloud se destacou como a oferta gerenciada natural sobre o Milvus, com melhorias de desempenho de nível empresarial.
P: O que se destacou no Zilliz Cloud durante sua avaliação? Quais foram os principais motivos que os levaram a escolher o Zilliz Cloud?
Exa: Algumas coisas se destacaram imediatamente.
Busca híbrida nativa: o Zilliz Cloud oferece suporte a busca vetorial densa e esparsa em uma única chamada de API, com estratégias integradas de reranking (RRF, ponderada). Esse era um requisito rígido para vários concorrentes, e nós não oferecíamos suporte nativo.
Desempenho em escala - o mecanismo de indexação Cardinal deles oferece tempos de consulta consistentemente rápidos, mesmo à medida que nossas coleções crescem para centenas de milhões de vetores.
Filtragem madura - a capacidade de combinar busca vetorial com filtros complexos de metadados em uma única solicitação, sem uma queda brusca de desempenho.
Em termos dos fatores decisivos para adoção:
Velocidade - a latência de consulta do Zilliz Cloud atendeu aos nossos requisitos rigorosos para busca em produção. Nossos usuários esperam resultados em milissegundos, e o Zilliz consegue oferecer suporte a isso.
Recursos de busca híbrida - a capacidade de combinar busca semântica densa com correspondência esparsa de palavras-chave BM25 e aplicar reranking por Reciprocal Rank Fusion (RRF) em uma única chamada de API foi importante para a qualidade da busca.
Simplicidade operacional - como um serviço totalmente gerenciado, o Zilliz Cloud permite que nossa equipe se concentre em criar melhores experiências de busca e iterar rapidamente em melhorias na infraestrutura de banco de dados vetorial em escala.
4. Como a arquitetura da Zilliz e da Exa se encaixa
Q: Como o Zilliz Cloud se encaixa na sua arquitetura?
Exa: Nossa arquitetura de busca de entidades compreende três camadas: ingestão, busca e API.
Na ingestão, enriquecemos e geramos embeddings dos dados de entidades usando nossos próprios pipelines de ML e, em seguida, fazemos upsert de vetores densos e esparsos no Zilliz Cloud.
Na busca, nosso backend gera embeddings a partir das consultas dos usuários e despacha solicitações de busca híbrida para o Zilliz Cloud, combinando correspondência semântica e por palavras-chave com reranking RRF.
Na camada de API, os resultados são enriquecidos com metadados estruturados e servidos por meio da nossa Search API e do produto Websets. O Zilliz Cloud fica no centro da recuperação para esse fluxo de trabalho: ele armazena todos os vetores e metadados de entidades e lida com buscas de baixa latência. Nosso índice web primário é construído e gerenciado em uma infraestrutura interna separada.
Q: Como tem sido a experiência da sua equipe usando o Zilliz Cloud ou o Milvus?
Exa: A API é intuitiva, a documentação é sólida e o sistema tem sido confiável em produção. A curva de aprendizado foi mínima porque os conceitos do Milvus: coleções, índices, parâmetros de busca, se alinham bem à forma como já pensamos sobre busca vetorial. A natureza gerenciada do Zilliz Cloud significa que tivemos pouquíssimos incidentes operacionais para lidar.
Q: Como tem sido a experiência de integrar o Zilliz Cloud com a AWS ou outros serviços de nuvem?
Exa: Perfeita. Executamos nossa infraestrutura principalmente na AWS, e o Zilliz Cloud se encaixa perfeitamente nessa stack nativa da AWS. Como ele roda na AWS, a latência de rede entre nossos serviços EKS e o Zilliz Cloud é mínima.
5. O que mudou após a adoção
Q: Quais são os 3 principais benefícios que vocês observaram? Você pode compartilhar métricas ou melhorias mensuráveis?
Exa: O primeiro benefício foi a velocidade de desenvolvimento: o serviço gerenciado e a API limpa significaram que nossa equipe pôde lançar novas verticais de busca de entidades rapidamente sem criar ou gerenciar infraestrutura adicional.
Além disso, a flexibilidade e adaptabilidade do schema foram muito importantes à medida que esses datasets verticais evoluem, e a qualidade da busca via autoindex também se mostrou valiosa na prática.
Q: Quais recursos do Zilliz Cloud você considera mais valiosos?
Exa: Duas coisas se destacam mais no uso diário.
Filtragem sem queda brusca de desempenho: filtros complexos de metadados sobrepostos à busca vetorial com impacto insignificante na latência.
Lançamentos rápidos de verticais: o escalonamento gerenciado nos permite lançar novas verticais de busca rapidamente sem implantar uma nova infraestrutura a cada vez.
Comece a usar o Zilliz Cloud
A Zilliz é a criadora do Milvus, o banco de dados vetorial de código aberto mais popular do mundo, e do Zilliz Cloud, o serviço de banco de dados vetorial totalmente gerenciado criado sobre o Milvus. O Zilliz Cloud permite que organizações criem aplicações de IA prontas para produção com busca vetorial de alto desempenho, recuperação híbrida e segurança e conformidade de nível empresarial.
- Comece a usar o Zilliz Cloud gratuitamente com US$ 100 em créditos ao se registrar com um e-mail empresarial
- 1. A promessa de produto da Exa: busca fundamentada para agentes de IA
- 2. O ponto de inflexão: de busca na web para busca de entidades
- 3. O que a Exa precisava de uma camada gerenciada de recuperação vetorial
- 4. Como a arquitetura da Zilliz e da Exa se encaixa
- 5. O que mudou após a adoção
- Comece a usar o Zilliz Cloud
Conteúdo
Caso de uso
Indústria
Infraestrutura de IA


