Como a Biomap transforma a descoberta em ciências da vida em escala com pesquisa vetorial impulsionada por IA usando Milvus

22× mais rápido
Pesquisas de proteínas com tempos de consulta reduzidos de 10–20 minutos para menos de um minuto.
50 bi+
O Sequence Scale expandiu de centenas de milhões para dezenas de bilhões de sequências biológicas.
Descoberta em Tempo Real
Respostas em menos de um segundo para consultas biológicas complexas em fluxos de trabalho RAG.
Integração Intermodal
Unificou proteínas, DNA, RNA, texto e dados celulares em uma única estrutura pesquisável.
Milvus has become the bridge that connects our multi-modal foundation models with real-world applications. It's not just about performance – it's about enabling entirely new approaches to biological discovery that were previously impossible.
Xiaoming Zhang
Sobre a Biomap
Biomap é uma empresa líder de IA em ciências da vida, focada na criação de modelos de IA que aceleram descobertas no desenvolvimento de medicamentos, biologia sintética e pesquisa médica. No centro de sua plataforma está xTrimo, uma família de modelos fundacionais de larga escala desenvolvidos especificamente para a biologia. Escalando até 210 bilhões de parâmetros, xTrimo unifica proteínas, DNA, RNA, células, moléculas e texto científico em uma única estrutura, fornecendo previsões e insights que os métodos tradicionais não conseguem igualar.
Alcançar essa capacidade exigiu superar barreiras técnicas, incluindo dados biológicos ruidosos, formatos altamente diversos e a necessidade de pesquisar bilhões de sequências em tempo real. A Biomap enfrentou esses desafios desenvolvendo modelos de incorporação personalizados para entidades biológicas e implantando infraestrutura de dados avançada, como o Milvus Vector Database, para permitir recuperação rápida e precisa em escala. Com essa base, pesquisadores agora podem acelerar avanços em vários campos, incluindo imunologia, neurologia, oncologia e o tratamento de doenças raras.
Barreiras técnicas para escalar a IA biológica
À medida que a Biomap expandia suas capacidades de IA, a equipe se deparou com vários gargalos que as ferramentas tradicionais não conseguiam superar.
1. Busca lenta de proteínas
O pipeline de previsão de estrutura de proteínas da Biomap anteriormente dependia do Alinhamento Múltiplo de Sequências (MSA), que exigia de 10 a 20 minutos para retornar um único resultado. Embora aceitável para pesquisas em pequena escala, esse atraso era impraticável para cargas de trabalho de produção, especialmente ao escalar para centenas de milhões — ou até bilhões — de sequências.
2. Complexidade de dados multimodais
Dados biológicos vêm inerentemente em muitas formas — proteínas, DNA, RNA, imagens celulares e até texto. Métodos de busca tradicionais não conseguiam conectar efetivamente essas modalidades, deixando de capturar o tipo de insights intermodais que são cruciais para compreender sistemas biológicos complexos.
3. Dilema entre velocidade e precisão
Na pesquisa biomédica, pequenos erros podem ter grandes consequências. O assistente de descoberta baseado em RAG da Biomap precisava tanto de respostas a consultas em menos de um segundo para interatividade quanto de precisão de nível de pesquisa para confiabilidade científica. No entanto, a maioria das soluções impunha uma escolha entre velocidade e precisão.
4. Requisitos de dados especializados
Dados biológicos têm características únicas que exigem estratégias de indexação personalizadas, modelos de incorporação específicos de domínio e otimização ajustada para cargas de trabalho científicas — capacidades que soluções prontas para uso não conseguiam oferecer.
5. Demandas de desempenho diversas
Diferentes casos de uso da Biomap tinham necessidades muito distintas: assistentes conversacionais exigiam respostas instantâneas, a previsão de proteínas podia tolerar minutos por consulta, mas precisava de processamento em lote eficiente, e o treinamento de modelos fundacionais exigia pipelines de dados de alto rendimento. Gerenciar esses requisitos diversos dentro de uma única infraestrutura unificada mostrou-se especialmente desafiador.
Por que a Biomap escolheu o Milvus para impulsionar a IA biológica em escala
A Biomap percebeu rapidamente que escalar suas cargas de trabalho de IA exigiria uma plataforma de busca vetorial desenvolvida especificamente para esse fim. A equipe primeiro recorreu ao Faiss, uma biblioteca popular de busca vetorial, para provas de conceito em pequena escala. Embora o Faiss tenha tido bom desempenho nos experimentos iniciais, ele falhou quando submetido a cargas de trabalho de produção, incapaz de atender aos requisitos de escala, confiabilidade e flexibilidade das aplicações reais em ciências da vida. Após testar várias alternativas, a equipe descobriu que o Milvus era a única solução que atendia a todos os critérios devido aos seguintes fatores:
Flexibilidade de Código Aberto: Os dados de ciências da vida são altamente especializados, frequentemente exigindo indexação e algoritmos personalizados, adaptados a casos de uso biológicos. O design de código aberto do Milvus deu à Biomap a liberdade de adaptar e estender o sistema sem restrições. Como Xiaoming Zhang, VP de Tecnologia da Biomap, explicou, “Se não for de código aberto, provavelmente não há espaço para tais personalizações, o que não se encaixa em nossos cenários.”
Estabilidade Pronta para Produção: Para implantações em produção, a Biomap precisava de uma plataforma madura, apoiada por uma base de usuários ativa, particularmente entre empresas de biotecnologia corporativas. Com um histórico comprovado em diversos setores e forte adoção pela comunidade entre empresas de biotecnologia, o Milvus ofereceu a confiabilidade e o suporte de ecossistema que a Biomap exigia.
Conjunto Abrangente de Recursos: O Milvus oferece suporte a uma ampla variedade de tipos de índices e recursos de busca híbrida, permitindo a otimização de buscas em proteínas, DNA, RNA, texto e outras modalidades — tudo dentro de um único sistema.
Desempenho em Escala: De assistentes interativos a buscas de proteínas em larga escala, a Biomap precisava de uma infraestrutura capaz de lidar tanto com consultas em menos de um segundo quanto com enormes tarefas em lote. A arquitetura horizontalmente escalável do Milvus garantiu desempenho consistente em todas as cargas de trabalho, independentemente de seu tamanho e escala.
Comunidade e Parceria: A equipe da Biomap também valorizou a comunidade ativa de código aberto do Milvus e o potencial de parceria de longo prazo com a Zilliz, a empresa por trás do Milvus.
Essa combinação de profundidade técnica, maturidade do ecossistema e suporte voltado para o futuro fez do Milvus a escolha clara para a infraestrutura de produção da Biomap.
Como a Biomap Usa o Milvus para Impulsionar Seus Serviços de IA Biológica
A Biomap implantou o Milvus em três casos de uso críticos, cada um abordando um desafio científico único e, juntos, formando a espinha dorsal de sua plataforma de IA biológica.
Assistente de Descoberta de IA (RAG)
No centro dos fluxos de trabalho de pesquisa da Biomap está um assistente de descoberta impulsionado por Geração Aumentada por Recuperação (RAG) avançada. Construído sobre o LangGraph para orquestração, o assistente extrai dados de vastas coleções de literatura científica, patentes e bancos de dados biológicos especializados. Esses dados, ricos em fórmulas, estruturas de proteínas e notação específica do domínio, são então convertidos em embeddings vetoriais e armazenados no Milvus.
O Milvus realiza busca vetorial híbrida e busca de texto completo para entregar os resultados mais precisos para consultas em frações de segundo. Isso permite que pesquisadores pesquisem em conhecimento biológico especializado e recebam respostas precisas em tempo real, em vez de passar horas vasculhando a literatura.
Predição de Estrutura de Proteínas em Escala
A Biomap também reinventou o pipeline tradicional de busca de proteínas ao substituir métodos lentos de Alinhamento Múltiplo de Sequências (MSA) por busca vetorial. Seus modelos fundacionais proprietários de proteínas geram embeddings de alta dimensionalidade, que são armazenados e consultados no Milvus. Essa nova arquitetura expandiu sua escala de busca de centenas de milhões para mais de 5 bilhões de sequências de proteínas, possibilitando descobertas que antes estavam fora de alcance. O desempenho também melhorou drasticamente: consultas que antes levavam 10–20 minutos agora são concluídas em menos de um minuto, com maior precisão graças a métricas de similaridade impulsionadas por IA.
Geração de Amostras Cross-Modal para Treinamento de Modelos
Para avançar no desenvolvimento de modelos fundacionais multimodais, a Biomap conta com o Milvus para conectar dados entre modalidades biológicas. Pesquisadores podem, por exemplo, recuperar imagens celulares vinculadas a sequências de proteínas específicas ou alinhar dados em nível molecular e em nível celular em um espaço vetorial unificado. Esse recurso oferece suporte à sofisticação do aumento de dados e à descoberta de associações cross-modal, acelerando o treinamento de modelos que conectam dados de texto, sequência e imagem.
Juntas, essas aplicações mostram como o Milvus permite que a Biomap combine escala, precisão e velocidade em diferentes domínios — da descoberta cotidiana ao treinamento de modelos biológicos de ponta.
Impacto do Milvus na Plataforma da Biomap
Ao adotar o Milvus, a Biomap alcançou resultados que a infraestrutura tradicional não conseguia entregar, transformando tanto a velocidade quanto o escopo de sua pesquisa.
Buscas Mais Rápidas em Escala de Bilhões
O mecanismo de indexação de alto desempenho do Milvus impulsionou uma aceleração de 22× nas buscas de sequências proteicas. Consultas que antes levavam de 10 a 20 minutos agora retornam em menos de um minuto, mesmo em escalas de 50 bilhões de sequências. Isso representa um aumento de escala de mais de 10 vezes — de centenas de milhões para dezenas de bilhões de sequências biológicas — sem sacrificar precisão ou confiabilidade.
Descoberta Biológica Mais Inteligente
O Milvus também mudou a forma como a Biomap aborda a própria descoberta. Como a qualidade da busca está diretamente ligada ao desempenho de seus modelos de base, melhorias na precisão do modelo se traduzem imediatamente em melhores resultados de recuperação. Isso cria um ciclo virtuoso: à medida que os modelos evoluem, o mecanismo de busca impulsionado pelo Milvus se torna mais preciso, desbloqueando insights científicos que métodos estáticos, baseados em alinhamento, jamais poderiam alcançar.
Avanços Intermodais
Com o Milvus, a Biomap agora consegue conectar dados em nível molecular e celular dentro do mesmo espaço vetorial. Esse “achatamento” das diferenças de escala possibilita buscas intermodais contínuas, apoiando o treinamento de seus modelos de base multimodais de próxima geração. É um passo fundamental rumo à sua visão de longo prazo de construir um simulador abrangente de IA para a biologia.
Uma Plataforma Escalável para Ciências da Vida
Em última análise, o Milvus fornece à Biomap a infraestrutura para expandir além da pesquisa interna para aplicações mais amplas em ciências da vida. A mesma plataforma agora dá suporte a bases de conhecimento personalizadas e agentes inteligentes para empresas farmacêuticas, hospitais e empresas de biologia sintética — estendendo os benefícios de uma IA biológica rápida e escalável a todo o ecossistema.
Olhando para o Futuro
O sucesso da Biomap com o Milvus lançou as bases para a expansão em todo o ecossistema de ciências da vida. A equipe agora está expandindo sua plataforma para atender a uma variedade de stakeholders, incluindo empresas farmacêuticas que aceleram a descoberta de medicamentos, instituições médicas que avançam a pesquisa clínica, empresas de biologia sintética que otimizam o design de organismos e empresas de biotecnologia agrícola que impulsionam melhorias genéticas em culturas. Cada novo caso de uso se baseia na mesma infraestrutura central — busca vetorial com o Milvus — que torna dados biológicos complexos acessíveis e acionáveis em escala.
Como Xiaoming observou, “O Milvus tornou-se a única escolha técnica para bancos de dados vetoriais em nossa próxima expansão de negócios em toda a indústria de ciências da vida.”
Essa parceria vai além da integração técnica. Ela está criando uma base para como a descoberta biológica será conduzida no futuro: mais rápida, mais precisa e capaz de abranger modalidades que antes eram isoladas. À medida que a Biomap continua perseguindo sua visão de um “simulador de IA para a vida”, a Zilliz fornece a infraestrutura de banco de dados vetorial que transforma essa ambição em realidade, possibilitando avanços que podem transformar tanto a ciência quanto a indústria.
- Sobre a Biomap
- Barreiras técnicas para escalar a IA biológica
- Por que a Biomap escolheu o Milvus para impulsionar a IA biológica em escala
- Como a Biomap Usa o Milvus para Impulsionar Seus Serviços de IA Biológica
- Impacto do Milvus na Plataforma da Biomap
- Olhando para o Futuro
Conteúdo
Indústria
Ciências da Vida
Milvus has become the only technical choice for vector databases in our upcoming business expansion across the life sciences industry.
Xiaoming Zhang


