Como a Solvely.ai escala o aprendizado de IA no mundo todo com busca vetorial ultrarrápida na Zilliz Cloud

Latência 70% menor
Recuperação vetorial em menos de 100 ms, mesmo durante picos de tráfego
Respostas 4–5× mais rápidas
Correspondência instantânea com soluções revisadas por especialistas para uma melhor experiência de aprendizagem
Custos de infraestrutura ~60% menores
Escalabilidade econômica para centenas de milhões de perguntas
Tempo de inatividade zero
Desempenho estável e confiável sob cargas de trabalho globais de alta concorrência
From a performance standpoint, Zilliz Cloud's retrieval speed far exceeds our existing system. We achieved approximately 70% reduction in retrieval latency, which translates to a 4-5x improvement in overall problem-solving time when we successfully match original questions. Whether measured by speed, cost, or overall value, Zilliz Cloud perfectly met our expectations.
Dr. Nick Yuan
Sobre a Solvely
Solvely.ai é uma plataforma de aprendizagem com tecnologia de IA que atende quase 10 milhões de estudantes, educadores e profissionais — abrangendo do ensino básico (K–12) ao ensino superior e à aprendizagem ao longo da vida. Conhecida por sua força em matemática, negócios, medicina e ciências da vida, bem como em disciplinas STEM, a Solvely transforma materiais de aprendizagem em explicações instantâneas, práticas personalizadas e guias de estudo multimodais.
O que diferencia a Solvely é sua abordagem híbrida: modelos de IA geram soluções inteligentes enquanto fazem referência cruzada com uma vasta biblioteca de conteúdo validado por especialistas, tornando-a uma ferramenta confiável para alunos que buscam precisão. Mas, à medida que esse banco de perguntas cresceu para centenas de milhões e sua base de usuários continuou a escalar rapidamente, entregar respostas rápidas e confiáveis tornou-se um grande desafio de engenharia. Essa pressão acabou levando a equipe a adotar o banco de dados vetorial Zilliz Cloud como o mecanismo por trás de sua recuperação vetorial.
Com o Zilliz Cloud, a Solvely agora oferece respostas mais rápidas, menor latência e uma experiência de aprendizagem mais fluida — ajudando milhões de alunos a obter o suporte de que precisam, exatamente quando precisam. À medida que a Solvely continua a expandir suas ofertas de produtos e seu alcance global, o Zilliz Cloud fornece uma base vetorial escalável e econômica que mantém a plataforma com desempenho máximo, aproximando a visão da Solvely de uma aprendizagem acessível e de alta qualidade um passo mais perto da realidade.
Dores de crescimento com o sistema legado
Uma das funcionalidades centrais da Solvely depende de corresponder rapidamente problemas enviados por estudantes a um banco de dados curado de perguntas e respostas verificadas e de alta qualidade. Essa abordagem combina a confiabilidade de um banco de perguntas estruturado com a flexibilidade e as capacidades de raciocínio dos grandes modelos de linguagem.
Para tornar isso possível, a Solvely usou busca por similaridade vetorial desde o início. Sistemas tradicionais baseados em palavras-chave e modelos só conseguiam corresponder texto de forma literal, deixando passar perguntas semelhantes formuladas de maneira ligeiramente diferente ou apresentadas de formas distintas. Com a busca vetorial, a Solvely podia incorporar uma pergunta de matemática ou ciências de um estudante e recuperar problemas conceitualmente semelhantes — dando suporte tanto a soluções curadas e precisas quanto a um raciocínio de IA aprimorado por meio de recuperação baseada em exemplos. Isso exigia duas capacidades principais de sua infraestrutura vetorial: agrupamento offline em larga escala para agrupar milhões de perguntas por conceito e busca online rápida e confiável para dar suporte a fluxos de trabalho de tarefas escolares em tempo real.
Nos estágios iniciais, os serviços existentes atendiam bem a essas necessidades. Com um conjunto de dados menor e menor volume de tráfego, a latência das consultas e os custos eram gerenciáveis, e a API simples do sistema ajudou a equipe a avançar rapidamente. Mas a escala traz complexidade. Com centenas de milhões de perguntas em sua biblioteca e milhões de usuários dependendo da plataforma, o desempenho e o custo começaram a se afastar do que a plataforma exigia. A latência, que antes era de algumas centenas de milissegundos, ultrapassava um segundo durante os horários de pico, quando muitos estudantes enviavam consultas simultaneamente. Esses atrasos tiveram um impacto direto na experiência dos estudantes.
Os custos também se tornaram um problema. Manter um desempenho aceitável exigia fazer upgrade para níveis significativamente mais caros, e o modelo de preços do sistema existente fazia com que os custos de armazenamento e busca aumentassem mais rápido do que o uso real da Solvely. Eventualmente, a equipe chegou a um ponto em que o sistema legado já não era sustentável. A Solvely precisava de menor latência, escalabilidade mais previsível e uma estrutura de custos adequada para uma plataforma global de educação em rápido crescimento. Essas pressões combinadas de desempenho e custo os levaram a avaliar bancos de dados vetoriais alternativos mais adequados para aplicações de IA de alto volume e sensíveis a custos.
Por que o Zilliz Cloud
Quando a Solvely começou a avaliar bancos de dados vetoriais alternativos, o Zilliz Cloud rapidamente se tornou um dos principais candidatos. A equipe já tinha ampla experiência com o Milvus—o banco de dados vetorial open-source amplamente adotado, criado pela equipe da Zilliz—durante suas fases iniciais de desenvolvimento. Essa familiaridade deu à Solvely confiança tanto na tecnologia quanto no ecossistema mais amplo ao considerar a migração para uma solução totalmente gerenciada.
Sua avaliação se concentrou em três critérios práticos:
Velocidade de recuperação sob alta concorrência
Eficiência de custos em escala
Simplicidade operacional
Para obter uma comparação precisa, a Solvely migrou uma fatia representativa de seus dados para o Zilliz Cloud e executou testes de benchmark diretamente em relação à sua implantação existente. Os resultados foram claros:
O Zilliz Cloud entregou velocidades de recuperação 2–3× mais rápidas sob carga idêntica.
A latência caiu de mais de 1 segundo para menos de 100 ms, mesmo durante picos de concorrência.
Os custos de infraestrutura caíram aproximadamente 60%, graças à utilização mais eficiente de recursos do Zilliz Cloud e ao modelo de preços favorável.
A simplicidade operacional se mostrou tão importante quanto o desempenho bruto. Com seu banco de questões se expandindo para centenas de milhões, a Solvely precisava de um serviço que escalasse suavemente sem exigir sobrecarga adicional de engenharia. O Zilliz Cloud atendeu a essa necessidade, permitindo que a equipe se concentrasse em melhorar a experiência de aprendizagem dos estudantes em vez de manter a infraestrutura de backend.
“Queríamos algo que pudesse nos apoiar para entrar em produção rapidamente, pronto para uso,” disse Dr. Nick Yuan, CTO da Solvely.
Além de velocidade e custo, o conjunto de recursos do Zilliz Cloud ofereceu a flexibilidade de que a Solvely precisava à medida que sua plataforma continuava a crescer. O gerenciamento de partições e clusters permitiu que eles organizassem seu enorme banco de questões por disciplina e tipo de conteúdo. O auto-scaling—tanto o escalonamento dinâmico baseado na carga em tempo real quanto o escalonamento programado para picos de tráfego previsíveis—garantiu um desempenho consistentemente forte durante os horários de pico de tarefas de casa.
A Solução: Impulsionando o Sistema de Aprendizagem por IA da Solvely com o Zilliz Cloud
O sistema da Solvely opera como um único pipeline de Geração Aumentada por Recuperação (RAG) de ponta a ponta, otimizado para a resolução de problemas educacionais. Em alto nível, o pipeline consiste em duas fases estreitamente conectadas:
Preparar antecipadamente um banco de questões grande e de alta qualidade
Realizar recuperação semântica de baixa latência em tempo real quando os estudantes enviam perguntas.
O Zilliz Cloud atua como a camada de recuperação vetorial em todo o pipeline, suportando tanto a indexação offline em larga escala quanto a busca online de alta concorrência.
Preparando o Banco de Questões
Antes que quaisquer consultas ao vivo sejam atendidas, a Solvely processa e organiza centenas de milhões de questões de várias fontes, incluindo fotos de tarefas de casa enviadas por estudantes e conjuntos de dados curados por especialistas. Como essas entradas variam amplamente em estrutura e qualidade, elas devem ser normalizadas e enriquecidas antes que possam ser pesquisadas de forma confiável em escala.
Ingestão de conteúdo: Imagens de tarefas de casa e questões criadas manualmente são inseridas no sistema em diferentes formatos. A Solvely limpa, deduplica e padroniza esse conteúdo para que possa ser processado uniformemente e indexado consistentemente no Zilliz Cloud.
Normalização consciente da disciplina: Cada questão é processada dentro de seu domínio acadêmico para preservar a estrutura e o significado específicos da disciplina, em vez de achatá-la em texto genérico. Por exemplo:
Química: fórmulas moleculares, símbolos de elementos e reações são mantidos intactos
Geometria: relações espaciais e informações relacionadas a diagramas são preservadas
Humanidades: o fluxo narrativo e o significado contextual são mantidos
Geração de embeddings: A Solvely gera embeddings para todo o corpus de questões usando modelos do Google ou da OpenAI. Esses vetores são armazenados e indexados antecipadamente no Zilliz Cloud, formando a base para a recuperação semântica de baixa latência no momento da consulta.
Integração direta com o Zilliz Cloud: Os vetores e metadados gerados são gravados diretamente no Zilliz Cloud. Ao manter o pipeline leve e evitar ferramentas complexas de orquestração, a Solvely mantém melhor controle de desempenho e consegue ajustar o sistema para diferentes disciplinas.
Recuperação em tempo real durante os fluxos de trabalho dos estudantes
Quando um estudante envia uma questão de dever de casa, a mesma infraestrutura preparada é ativada em tempo real. Esse fluxo de trabalho online precisa ser rápido, confiável e capaz de lidar com entradas acadêmicas complexas sob alta concorrência.
Pré-processamento da questão:
Se a questão for enviada como uma imagem, o OCR primeiro extrai o texto. Em seguida, o sistema identifica fórmulas, símbolos e pistas relacionadas a diagramas e converte a entrada em uma representação limpa e padronizada, adequada para embedding.
Busca vetorial com o Zilliz Cloud:
A questão processada é convertida em um vetor de mais de 1000 dimensões usando modelos de embedding do Google ou da OpenAI e enviada ao Zilliz Cloud para recuperação por similaridade. Esse processo permite que o sistema pesquise por significado em vez de correspondência exata de palavras.
Em seguida, a Solvely realiza dois tipos de recuperações complementares:
Busca de conhecimento de base: Traz informações de base específicas da disciplina, como constantes químicas, identidades matemáticas ou material de referência relevante. Esse embasamento ajuda o LLM a raciocinar com mais precisão e reduz respostas sem suporte ou alucinadas.
Busca de questões semelhantes:: Encontra questões previamente resolvidas e revisadas por humanos no banco de dados da Solvely. Esses candidatos são reclassificados por um LLM para capturar similaridades sutis que a busca vetorial sozinha pode não perceber, garantindo que os exemplos mais relevantes sejam usados.
Uso do conteúdo recuperado com consciência da disciplina:
A Solvely aplica regras diferentes dependendo da disciplina. Para matemática e ciências, os exemplos recuperados ajudam a IA a entender o método de solução sem copiar números ou respostas exatas. Para humanidades, o material recuperado fornece base e contexto para apoiar a explicação e a interpretação, em vez de oferecer uma resposta fixa.
Reformulação da consulta para maior qualidade da resposta:
Por fim, o sistema pode reformular a pergunta original para capturar sua intenção mais ampla — por exemplo, focando no conceito subjacente em vez da redação exata. Isso ajuda a recuperar contexto útil que pode não ser uma correspondência textual direta, mas é essencial para resolver o problema corretamente.
O processo de migração foi surpreendentemente tranquilo
Uma das maiores preocupações da Solvely ao trocar de banco de dados era a própria migração. Eles tinham centenas de milhões de questões armazenadas no sistema existente — quanto tempo levaria para mover todos esses dados? Seria necessário escrever scripts de migração complexos? Haveria tempo de inatividade afetando os usuários?
Na prática, a migração foi notavelmente tranquila. O Zilliz Cloud forneceu ferramentas de migração integradas que se conectam diretamente ao sistema anterior deles. O processo foi essencialmente de um clique — configurar a conexão, especificar o que migrar e deixar o pipeline rodar. As ferramentas cuidaram do trabalho pesado de transferência de vetores, gerenciamento de metadados e preservação estrutural. A equipe não precisou escrever nenhum código personalizado nem orquestrar um pipeline de dados complexo.
Resultados e impacto
Após migrar para o Zilliz Cloud, a Solvely observou melhorias mensuráveis em várias dimensões:
Latência 70% menor: A latência na etapa de recuperação diminuiu aproximadamente 70% em comparação com a implantação anterior. Durante picos de tráfego, consultas que antes levavam mais de um segundo agora são concluídas em dezenas a poucas centenas de milissegundos.
Custo de infraestrutura ~60% menor: Os custos mensais de infraestrutura para busca vetorial caíram cerca de 60% imediatamente após a migração, enquanto lidavam com volumes de consultas equivalentes ou maiores.
Maior precisão de busca: Para assuntos em que os LLMs tradicionalmente têm dificuldade, como química, geometria e cálculo, a abordagem baseada em RAG melhorou significativamente a precisão das soluções. Considerando que o desempenho do modelo de base já é forte, esse ganho incremental é significativo.
Zero tempo de inatividade, alta disponibilidade: Desde a migração, eles tiveram zero tempo de inatividade e problemas mínimos de desempenho. O sistema lida sem dificuldade com condições de carga variáveis. Quando encontram dúvidas ou querem otimizar algo, recebem respostas rápidas da equipe de suporte liderada por especialistas técnicos que compreendem bem seu caso de uso.
Além das melhorias de desempenho, a equipe de engenharia da Solvely também observou benefícios operacionais claros. A documentação e os exemplos da Zilliz Cloud facilitaram o início, e a equipe de suporte respondeu rapidamente quando surgiram problemas. Recursos como escalonamento automático e programado reduziram o trabalho diário de gerenciamento da infraestrutura, para que a equipe pudesse se concentrar mais na construção do produto.
Lições Aprendidas
A experiência da Solvely destaca algumas conclusões práticas para equipes que constroem sistemas de recuperação semelhantes baseados em IA:
Perguntas semelhantes importam tanto quanto correspondências exatas. Inicialmente, a equipe esperava depender fortemente de correspondências exatas de perguntas. Na prática, perguntas semelhantes com pequenas variações (como valores numéricos alterados) provaram ser igualmente valiosas. Fornecê-las como contexto ao LLM melhorou a qualidade das respostas mesmo quando não existia uma correspondência exata.
Reescrever consultas ajuda a encontrar resultados mais relevantes. Em vez de incorporar a pergunta original do usuário como está, reescrevê-la para corresponder melhor à forma como os dados são armazenados no banco de dados vetorial levou a melhores resultados de busca.
Reordenar os resultados após a recuperação melhora a precisão. Usar um LLM para avaliar e classificar candidatos recuperados antes da geração da resposta final ajudou a destacar as correspondências mais relevantes, particularmente para perguntas envolvendo elementos visuais como diagramas ou fórmulas.
A recuperação baseada em texto ainda funciona bem. Embora a incorporação multimodal seja uma área ativa de interesse, a equipe descobriu que OCR seguido de incorporação de texto entregou resultados mais confiáveis do que as abordagens atuais de incorporação de imagens para seu caso de uso educacional.
Serviços gerenciados aceleram a iteração. Escolher um banco de dados vetorial totalmente gerenciado permitiu que a equipe concentrasse o esforço de engenharia em seu produto principal, em vez de operações de infraestrutura.
Olhando para o futuro, a Solvely planeja testar a busca híbrida, que combina busca semântica com busca por palavras-chave — especialmente útil para materiais de curso em que termos exatos importam. Eles também estão acompanhando melhorias na incorporação multimodal, que podem eventualmente permitir busca direta de imagem para imagem para disciplinas com muitos diagramas.
Conclusão
Quando a Solvely.ai decidiu democratizar a educação por meio da inteligência artificial em 2023, eles sabiam que a infraestrutura técnica seria fundamental para sua missão. O que eles não previram foi a rapidez com que superariam sua solução inicial de banco de dados vetorial. À medida que seu banco de dados de perguntas explodiu para centenas de milhões de entradas e sua base de usuários cresceu para 10 milhões de estudantes em todo o mundo, a latência das consultas se tornou um gargalo que ameaçava a própria experiência do usuário que estavam tentando aperfeiçoar.
A migração para a Zilliz Cloud transformou sua base técnica. A latência das consultas caiu 70%, os custos de infraestrutura diminuíram 60% e, mais importante, os estudantes puderam obter ajuda com sua lição de casa de 4 a 5 vezes mais rápido quando o sistema correspondia perguntas de seu banco de dados curado. Mas, além dos números, a Zilliz Cloud deu à Solvely algo mais valioso: a liberdade de se concentrar na criação de produtos educacionais inovadores, em vez de lutar com operações de banco de dados.
À medida que a Solvely.ai continua a expandir suas ofertas de produtos e sua base de usuários, o Zilliz Cloud fornece a base de banco de dados vetorial escalável e econômica necessária para atender milhões de estudantes em todo o mundo, aproximando a visão de igualdade educacional da realidade.
The migration was incredibly smooth. Using the built-in tools, we were able to import our data from Pinecone with essentially one click. The technical support has also been excellent — our questions get resolved almost instantly, and the documentation, demos, and examples are thorough and easy to work with.
Technical Team


