Criando agentes de IA em escala: como a Tanka aproveitou o Zilliz Cloud para comunicação empresarial inteligente

0 Problemas de produção
relacionado à instabilidade da infraestrutura
Milhares de buscas vetoriais
por segundo durante os horários de pico
Motor de Memória Semântica
Entendendo conceitos e relacionamentos entre ferramentas e ao longo do tempo
100% da largura de banda da equipe
redirecionado para a inovação em IA
Sobre a Tanka
A Tanka é uma plataforma de agentes empresariais projetada para atuar como seu Cofundador de IA. Criada para o local de trabalho moderno, a Tanka ajuda equipes de startups a navegar pelo caos de mensagens dispersas, entregas desorganizadas e tarefas repetitivas. Com sua memória de longo prazo única, a Tanka captura e conecta conversas em ferramentas como Slack, Gmail, Notion e outras, transformando comunicação fragmentada em conhecimento organizacional compartilhado.
Ao entregar respostas conscientes do contexto, resumir reuniões e enviar lembretes de tarefas no momento certo, a Tanka impulsiona a produtividade da equipe e a tomada de decisões. Desde o lançamento de sua versão beta em 2024, a Tanka foi adotada por mais de 1.000 equipes e entregou mais de 35.000 respostas geradas por IA.
O Desafio da Compreensão Semântica: Quando a Busca por Palavras-chave Não é Suficiente
A rápida adoção da Tanka validou sua proposta de valor central: viabilizar assistentes de IA que não apenas respondem — eles lembram, aprendem e entendem o contexto de negócios ao longo do tempo. Mas escalar essa visão trouxe desafios técnicos, especialmente à medida que os usuários exigiam mais da plataforma.
Nos primeiros dias, a equipe da Tanka usou recuperação baseada em palavras-chave BM25 — uma escolha pragmática que permitiu avançar rapidamente e dar suporte de forma eficaz a casos de uso básicos de busca. Funcionava bem para consultas simples e ajudou a equipe a lançar rapidamente um MVP funcional.
No entanto, à medida que a plataforma se expandiu para dar suporte a Outlook, Gmail, Slack, Telegram, Notion e outras ferramentas, a complexidade dos modelos de dados — e das expectativas dos usuários — cresceu significativamente. As equipes já não estavam procurando palavras-chave isoladas. Elas faziam perguntas sutis e contextuais que exigiam que o sistema entendesse relações entre mensagens, reuniões, documentos e aplicativos.
“Começamos com busca por palavras-chave para consultas simples”, diz Wu Junjie, Arquiteto de IA na Tanka. “Mas, à medida que as necessidades dos nossos usuários evoluíram, ficou claro que eles esperavam respostas semânticas — não apenas correspondências de strings.”
Isso marcou o início de um desafio mais profundo: preencher a lacuna semântica entre o que os usuários queriam dizer e o que sistemas baseados em palavras-chave conseguiam entregar. Por exemplo, os usuários podiam pedir um resumo de “o que mudou após o lançamento do produto” ou “acompanhamentos da reunião de vendas da última sexta-feira” — consultas que exigiam cruzar e-mails, conversas e notas de reunião. Para humanos, as conexões eram óbvias. Para o mecanismo de busca, eram invisíveis.
Enquanto isso, os riscos aumentavam. Em um espaço competitivo em que velocidade e inteligência eram diferenciais-chave, a infraestrutura de busca existente da Tanka começou a mostrar sinais de desgaste. O desempenho sofreu à medida que os volumes de dados cresceram. A latência da busca aumentou, especialmente para consultas amplas sem filtros claros. Mas o problema mais profundo não era a velocidade — era o desalinhamento estratégico.
A equipe de engenharia se viu atolada na manutenção de uma infraestrutura de busca frágil em vez de construir os principais recursos de IA em seu roadmap. Capacidades visionárias — como insights de múltiplas fontes, resumos semanais inteligentes ou acompanhamentos preditivos — continuavam logo fora de alcance.
A equipe da Tanka percebeu que a busca por palavras-chave os havia levado longe — mas não longe o suficiente. Para desbloquear a próxima fase de sua visão de produto, eles precisavam de um sistema que pudesse realmente entender a intenção do usuário ao longo do tempo, das ferramentas e do contexto.
A Solução: Escalar Memória com Desempenho e Confiabilidade
Diante de desafios técnicos e operacionais crescentes, a equipe da Tanka decidiu encontrar uma solução que pudesse dar suporte ao seu ambicioso roadmap de produto, ao mesmo tempo em que entregasse a confiabilidade que os usuários esperavam de um assistente de IA com memória de longo prazo.
Avaliando Opções de Busca Vetorial
A Tanka lançou um processo de avaliação estruturado e aprofundado para explorar possíveis soluções. Entre os primeiros concorrentes estavam PostgreSQL com pgvector e plugins do Elasticsearch — atraentes à primeira vista devido à compatibilidade com sua stack existente. Mas testes de desempenho rapidamente revelaram suas limitações, especialmente para cargas de trabalho intensivas em memória.
A equipe realizou comparações diretas em critérios-chave: tempo de resposta, throughput, utilização de CPU e escalabilidade geral. Embora a maioria das plataformas oferecesse precisão semelhante—já que os algoritmos de similaridade vetorial são amplamente padronizados—o Milvus se destacou por sua velocidade superior e eficiência de recursos.
"Embora a precisão fosse comparável entre as plataformas, o Milvus venceu claramente em velocidade e eficiência de recursos", diz Wu Junjie, Arquiteto de IA na Tanka.
Durante a avaliação, a equipe priorizou:
Velocidade de consulta, que era crítica para manter a ilusão de inteligência em tempo real;
Eficiência de CPU, para manter os custos de infraestrutura sustentáveis em escala;
Confiabilidade operacional, essencial para a confiança em um assistente com memória em primeiro lugar.
Escalabilidade, para dar suporte a volumes de dados e bases de usuários em rápido crescimento.
Da Auto-hospedagem a um Serviço Gerenciado
A Tanka inicialmente implantou o Milvus auto-hospedado em desenvolvimento e no início da produção. Foi a escolha certa e forneceu a busca vetorial de baixa latência que o produto deles exigia. O Milvus cumpriu sua principal promessa—busca por similaridade poderosa e eficiente em escala.
No entanto, à medida que a plataforma amadureceu e o uso cresceu, o peso de gerenciar a infraestrutura começou a se tornar uma distração. Executar e manter clusters Milvus internamente significava que a equipe de engenharia precisava gerenciar tudo, desde escalabilidade e failover até monitoramento e recuperação.
Embora o mecanismo Milvus em si permanecesse confiável, incidentes relacionados à infraestrutura—como falhas de nós ou problemas de rede—introduziam risco e tempo de inatividade que impactavam diretamente a experiência do usuário.
Com o tempo, a troca ficou clara: a equipe precisava se concentrar em criar recursos de produto, não em manter infraestrutura de banco de dados.
Migrando para o Zilliz Cloud
A escolha de migrar para o Zilliz Cloud, a versão totalmente gerenciada do Milvus, ficou clara. Ele entregava o mesmo núcleo de alto desempenho com confiabilidade de nível empresarial, sem a sobrecarga de gerenciar clusters internamente.
Para uma equipe enxuta e ágil como a da Tanka, transferir a complexidade operacional foi um divisor de águas:
Chega de apagar incêndios com problemas de infraestrutura
Maior uptime e consistência para aplicações críticas de memória
Mais tempo de engenharia para focar em inovação e experiência do usuário
O serviço de migração integrado da Zilliz tornou a transição tranquila e de baixo risco. Com suporte técnico ágil e integração perfeita com S3, a equipe da Tanka migrou para a nuvem com interrupção mínima.
A Implementação: Impulsionando Memória Avançada de IA com o Zilliz Cloud
Com uma infraestrutura confiável em vigor, a Tanka finalmente pôde mudar seu foco para o que realmente a diferenciava: criar capacidades avançadas de memória para sua plataforma de mensagens AI-native que vão muito além da simples busca. Impulsionada pelo Zilliz Cloud, a implementação da Tanka foi projetada para dar suporte a aplicações ricas e sensíveis ao contexto, que tornam o conhecimento organizacional acionável em escala.
Além da Recuperação Básica: Memória Semântica em Escala
No núcleo do sistema da Tanka está um pipeline de geração aumentada por recuperação (RAG), permitindo que os usuários acessem informações relevantes em suas ferramentas de trabalho conectadas, como Slack, Gmail e Notion. No entanto, ao contrário dos sistemas RAG típicos que recuperam documentos com base em similaridade superficial, a Tanka vai um passo além.
Durante o pré-processamento, a Tanka realiza extração de entidades e relacionamentos para capturar conceitos de nível mais alto a partir de conteúdo bruto. Eles são então convertidos em embeddings vetoriais e armazenados no Zilliz Cloud, permitindo a recuperação com base não apenas no que foi dito, mas também em como diferentes ideias, pessoas e ações estão conectadas.
Isso permite que os usuários façam perguntas complexas e abstratas—como “Quais foram os principais acompanhamentos dos nossos esforços de planejamento do Q3?”—e recebam respostas fundamentadas em conhecimento estruturado, em vez de correspondências de palavras-chave.
Essa abordagem transforma o Zilliz Cloud de uma camada de armazenamento em um mecanismo de memória semântica, ajudando o assistente a entender contexto, histórico e padrões em toda a organização.
Processamento em Tempo Real e Atualizações Contínuas
O sistema da Tanka ingere e processa dados de plataformas conectadas em tempo real, garantindo que o assistente de IA sempre reflita o estado organizacional mais recente. À medida que as equipes se comunicam e colaboram, novos vetores são gerados e indexados no Zilliz Cloud, mantendo o assistente atualizado sem exigir intervenção manual.
O pipeline inclui:
Ingestão de múltiplas fontes a partir de emails, chats e documentos
Pré-processamento para extração de entidades e relacionamentos
Incorporação vetorial e indexação no Zilliz Cloud para recuperação semântica rápida
Isso permite que o assistente de IA atue como uma camada de memória viva—ajudando os usuários a revelar insights, recuperar decisões e compreender a dinâmica em evolução das equipes.
Uma Pilha de IA Flexível e Multimodelo
Para complementar essa infraestrutura, a Tanka usa uma estratégia de LLM flexível e multimodelo. O sistema depende principalmente do Gemini 2 Flash e do Claude 3.7 Sonnet para raciocínio e sumarização, com modelos da OpenAI aplicados seletivamente para tarefas com muitas instruções. Para evitar limitação de taxa e garantir desempenho resiliente entre provedores, a Tanka usa o OpenRouter para gerenciar o acesso e o roteamento de APIs.
Os Benefícios e Resultados: Impacto Transformacional nos Negócios
A parceria com o Zilliz Cloud não apenas resolveu pontos problemáticos técnicos para a Tanka—ela remodelou a trajetória da empresa. Com a infraestrutura estabilizada e o desempenho otimizado, a equipe finalmente pôde mudar o foco do combate operacional a incêndios para a inovação em IA. Os benefícios alcançaram todas as camadas da organização, desbloqueando novos níveis de velocidade, confiabilidade e escala.
Alívio Operacional Imediato
O impacto mais imediato—e dramático—foi a eliminação de problemas de produção relacionados à instabilidade da infraestrutura. Antes de migrar para o Zilliz Cloud, incidentes relacionados ao banco de dados ocasionalmente interrompiam o serviço e comprometiam a confiança dos usuários. Esse não é mais o caso.
“Depois de migrar para o Zilliz Cloud, basicamente eliminamos os problemas de produção relacionados a falhas de banco de dados,” diz Wu Junjie, Arquiteto de IA na Tanka. “Costumávamos ter incidentes ocasionais que afetavam os usuários. Agora, esses problemas desapareceram.”
Essa melhoria foi crítica para uma plataforma construída sobre a promessa de memória organizacional persistente. Com a confiabilidade do banco de dados deixando de ser uma preocupação, os usuários puderam contar com acesso rápido e ininterrupto ao conhecimento acumulado—dia após dia.
Redirecionando a Engenharia para a Inovação
Com as preocupações de infraestrutura para trás, a equipe de engenharia da Tanka conseguiu realocar seu tempo para o desenvolvimento de produtos e a inovação. Em vez de lidar com failovers, backups e alertas, os engenheiros puderam se concentrar em criar os recursos que definem a vantagem competitiva da Tanka.
“O desempenho e a confiabilidade da Zilliz atendem plenamente aos nossos requisitos de RAG,” diz Wu Junjie. “Isso nos permite concentrar nossos esforços técnicos na criação de capacidades diferenciadas de memória de IA—onde está nosso verdadeiro valor.”
A mudança levou a ciclos de iteração mais rápidos, lançamentos de recursos mais ambiciosos e um alinhamento mais estreito entre o esforço de engenharia e a estratégia de negócios.
Desempenho Consistente em Escala Massiva
À medida que a base de usuários da Tanka cresceu, também cresceram as demandas sobre seu backend. O sistema agora processa milhares de operações simultâneas de busca vetorial por segundo durante horários de pico, extraindo de mais de três anos de dados organizacionais que abrangem milhões de mensagens, documentos e eventos.
Essa consistência de desempenho removeu os limites de infraestrutura como fator no planejamento de produtos. A equipe da Tanka agora pode construir e escalar sem hesitação, sabendo que seu backend acompanhará o ritmo.
Conclusão
A jornada da Tanka—dos primeiros desafios de infraestrutura ao sucesso em produção com o Zilliz Cloud—destaca uma lição poderosa: a base certa de banco de dados vetorial não apenas melhora o desempenho; ela desbloqueia a inovação.
Ao fazer parceria com a Zilliz Cloud, a Tanka eliminou incidentes de produção, aumentou a produtividade da engenharia e alcançou desempenho consistente em escala. Mais importante ainda, a mudança permitiu que a Tanka se concentrasse inteiramente em sua missão principal: criar capacidades de memória de última geração para AI Assistants que vão muito além da recuperação básica.
Para empresas de IA que desenvolvem aplicações com uso intensivo de memória, a experiência da Tanka mostra como as decisões de infraestrutura impactam diretamente a velocidade da inovação e o sucesso do produto. Desempenho, confiabilidade e simplicidade operacional não são apenas requisitos técnicos — são facilitadores estratégicos.
Com a base certa estabelecida, a Tanka transformou sua visão ambiciosa em uma realidade líder de mercado — provando que, quando a infraestrutura capacita em vez de restringir, a IA revolucionária não é apenas possível, mas inevitável.
- Sobre a Tanka
- O Desafio da Compreensão Semântica: Quando a Busca por Palavras-chave Não é Suficiente
- A Solução: Escalar Memória com Desempenho e Confiabilidade
- A Implementação: Impulsionando Memória Avançada de IA com o Zilliz Cloud
- Os Benefícios e Resultados: Impacto Transformacional nos Negócios
- Conclusão
Conteúdo
Indústria


