Creación de agentes de IA a escala: cómo Tanka aprovechó Zilliz Cloud para la comunicación empresarial inteligente

0 problemas de producción
relacionado con la inestabilidad de la infraestructura
Miles de búsquedas vectoriales
por segundo durante las horas pico
Motor de Memoria Semántica
Comprender conceptos y relaciones entre herramientas y a lo largo del tiempo
100% de la capacidad del equipo
redirigido a la innovación en IA
Acerca de Tanka
Tanka es una plataforma de agentes empresariales diseñada para actuar como tu cofundador de IA. Creada para el lugar de trabajo moderno, Tanka ayuda a los equipos de startups a navegar el caos de mensajes dispersos, entregables desordenados y tareas repetitivas. Con su memoria única a largo plazo, Tanka captura y conecta conversaciones entre herramientas como Slack, Gmail, Notion y más, transformando la comunicación fragmentada en conocimiento organizacional compartido.
Al ofrecer respuestas conscientes del contexto, resumir reuniones y enviar recordatorios de tareas oportunos, Tanka impulsa la productividad del equipo y la toma de decisiones. Desde el lanzamiento de su beta en 2024, Tanka ha sido adoptado por más de 1.000 equipos y ha entregado más de 35.000 respuestas generadas por IA.
El desafío de la comprensión semántica: cuando la búsqueda por palabras clave no es suficiente
La rápida adopción de Tanka validó su propuesta de valor principal: habilitar asistentes de IA que no solo respondan, sino que recuerden, aprendan y comprendan el contexto empresarial con el tiempo. Pero escalar esa visión trajo desafíos técnicos, especialmente a medida que los usuarios exigían más de la plataforma.
En sus primeros días, el equipo de Tanka utilizó recuperación basada en palabras clave BM25, una elección pragmática que les permitió avanzar rápidamente y dar soporte de manera efectiva a casos de uso de búsqueda básicos. Funcionó bien para consultas simples y ayudó al equipo a lanzar rápidamente un MVP funcional.
Sin embargo, a medida que la plataforma se expandió para dar soporte a Outlook, Gmail, Slack, Telegram, Notion y otras herramientas, la complejidad de los modelos de datos —y las expectativas de los usuarios— creció significativamente. Los equipos ya no buscaban palabras clave aisladas. Hacían preguntas matizadas y contextuales que requerían que el sistema comprendiera relaciones entre mensajes, reuniones, documentos y aplicaciones.
“Comenzamos con la búsqueda por palabras clave para consultas simples”, dice Wu Junjie, arquitecto de IA en Tanka. “Pero a medida que evolucionaron las necesidades de nuestros usuarios, quedó claro que esperaban respuestas semánticas, no solo coincidencias de cadenas.”
Esto marcó el inicio de un desafío más profundo: cerrar la brecha semántica entre lo que los usuarios querían decir y lo que los sistemas basados en palabras clave podían ofrecer. Por ejemplo, los usuarios podían pedir un resumen de “lo que cambió después del lanzamiento del producto” o “seguimientos de la reunión de ventas del viernes pasado”, consultas que requerían cruzar correos electrónicos, chats y notas de reuniones. Para las personas, las conexiones eran obvias. Para el motor de búsqueda, eran invisibles.
Mientras tanto, lo que estaba en juego iba en aumento. En un espacio competitivo donde la velocidad y la inteligencia eran diferenciadores clave, la infraestructura de búsqueda existente de Tanka comenzó a mostrar señales de tensión. El rendimiento se vio afectado a medida que crecían los volúmenes de datos. La latencia de búsqueda aumentó, especialmente para consultas amplias sin filtros claros. Pero el problema más profundo no era la velocidad, sino la desalineación estratégica.
El equipo de ingeniería se encontró atrapado manteniendo una infraestructura de búsqueda frágil en lugar de construir las funciones principales de IA de su hoja de ruta. Capacidades visionarias —como perspectivas de múltiples fuentes, resúmenes semanales inteligentes o seguimientos predictivos— seguían quedando apenas fuera de alcance.
El equipo de Tanka se dio cuenta de que la búsqueda por palabras clave los había llevado lejos, pero no lo suficientemente lejos. Para desbloquear la siguiente fase de su visión de producto, necesitaban un sistema que pudiera comprender verdaderamente la intención del usuario a través del tiempo, las herramientas y el contexto.
La solución: escalar la memoria con rendimiento y fiabilidad
Ante crecientes desafíos técnicos y operativos, el equipo de Tanka se propuso encontrar una solución que pudiera respaldar su ambiciosa hoja de ruta de producto y, al mismo tiempo, ofrecer la fiabilidad que los usuarios esperaban de un asistente de IA con memoria a largo plazo.
Evaluación de opciones de búsqueda vectorial
Tanka lanzó un proceso de evaluación estructurado y profundo para explorar posibles soluciones. Entre los primeros contendientes estuvieron PostgreSQL con pgvector y plugins de Elasticsearch, atractivos a primera vista por su compatibilidad con su stack existente. Pero las pruebas de rendimiento revelaron rápidamente sus limitaciones, especialmente para cargas de trabajo intensivas en memoria.
El equipo realizó comparaciones directas según criterios clave: tiempo de respuesta, rendimiento, utilización de CPU y escalabilidad general. Si bien la mayoría de las plataformas ofrecían una precisión similar —ya que los algoritmos de similitud vectorial están en gran medida estandarizados—, Milvus destacó por su velocidad superior y eficiencia de recursos.
"Si bien la precisión era comparable entre plataformas, Milvus ganó claramente en velocidad y eficiencia de recursos", afirma Wu Junjie, arquitecto de IA en Tanka.
Durante la evaluación, el equipo priorizó:
Velocidad de consulta, que era fundamental para mantener la ilusión de inteligencia en tiempo real;
Eficiencia de CPU, para mantener los costos de infraestructura sostenibles a escala;
Fiabilidad operativa, esencial para la confianza en un asistente centrado en la memoria.
Escalabilidad, para respaldar volúmenes de datos y bases de usuarios de rápido crecimiento.
Del autoalojamiento a un servicio gestionado
Tanka desplegó inicialmente Milvus autoalojado en desarrollo y producción temprana. Fue la elección correcta y proporcionó la búsqueda vectorial de baja latencia que su producto requería. Milvus cumplió su promesa principal: búsqueda de similitud potente y eficiente a escala.
Sin embargo, a medida que la plataforma maduró y el uso creció, la carga de gestionar la infraestructura comenzó a convertirse en una distracción. Ejecutar y mantener clústeres de Milvus internamente significaba que el equipo de ingeniería tenía que gestionar todo, desde el escalado y la conmutación por error hasta la monitorización y la recuperación.
Si bien el motor de Milvus en sí seguía siendo fiable, los incidentes relacionados con la infraestructura —como fallos de nodos o problemas de red— introducían riesgos y tiempos de inactividad que impactaban directamente en la experiencia del usuario.
Con el tiempo, la compensación se hizo evidente: el equipo necesitaba centrarse en crear funcionalidades del producto, no en mantener la infraestructura de bases de datos.
Migración a Zilliz Cloud
La elección de pasar a Zilliz Cloud, la versión completamente gestionada de Milvus, se hizo evidente. Ofrecía el mismo núcleo de alto rendimiento con fiabilidad de nivel empresarial, sin la sobrecarga de gestionar clústeres internamente.
Para un equipo ágil y dinámico como el de Tanka, externalizar la complejidad operativa supuso un cambio radical:
No más gestión de emergencias por problemas de infraestructura
Mayor tiempo de actividad y consistencia para aplicaciones críticas de memoria
Más tiempo de ingeniería para centrarse en la innovación y la experiencia del usuario
El servicio de migración integrado de Zilliz hizo que la transición fuera fluida y de bajo riesgo. Con soporte técnico rápido e integración perfecta con S3, el equipo de Tanka se trasladó a la nube con una interrupción mínima.
La implementación: potenciando la memoria avanzada de IA con Zilliz Cloud
Con una infraestructura fiable en marcha, Tanka finalmente pudo cambiar su enfoque hacia lo que realmente la diferenciaba: crear capacidades de memoria avanzadas para su plataforma de mensajería nativa de IA que van mucho más allá de la búsqueda simple. Impulsada por Zilliz Cloud, la implementación de Tanka está diseñada para admitir aplicaciones ricas y conscientes del contexto que hacen que el conocimiento organizacional sea accionable a escala.
Más allá de la recuperación básica: memoria semántica a escala
En el núcleo del sistema de Tanka hay un pipeline de generación aumentada por recuperación (RAG), que permite a los usuarios acceder a información relevante en sus herramientas de trabajo conectadas, como Slack, Gmail y Notion. Sin embargo, a diferencia de los sistemas RAG típicos que recuperan documentos basándose en similitudes superficiales, Tanka va un paso más allá.
Durante el preprocesamiento, Tanka realiza extracción de entidades y relaciones para capturar conceptos de nivel superior a partir del contenido en bruto. Luego se convierten en embeddings vectoriales y se almacenan en Zilliz Cloud, lo que permite la recuperación basada no solo en lo que se dijo, sino también en cómo se conectan diferentes ideas, personas y acciones.
Esto permite a los usuarios hacer preguntas complejas y abstractas —como “¿Cuáles fueron los seguimientos clave de nuestros esfuerzos de planificación del Q3?”— y recibir respuestas fundamentadas en conocimiento estructurado en lugar de coincidencias de palabras clave.
Este enfoque transforma Zilliz Cloud de una capa de almacenamiento en un motor de memoria semántica, ayudando al asistente a comprender el contexto, el historial y los patrones en toda la organización.
Procesamiento en tiempo real y actualizaciones continuas
El sistema de Tanka ingiere y procesa datos de plataformas conectadas en tiempo real, lo que garantiza que el asistente de IA siempre refleje el estado organizacional más reciente. A medida que los equipos se comunican y colaboran, se generan nuevos vectores y se indexan en Zilliz Cloud, manteniendo al asistente actualizado sin requerir intervención manual.
El pipeline incluye:
Ingesta multisource desde correos electrónicos, chats y documentos
Preprocesamiento para la extracción de entidades y relaciones
Embedding vectorial e indexación en Zilliz Cloud para una recuperación semántica rápida
Esto permite que el asistente de IA actúe como una capa de memoria viva, ayudando a los usuarios a sacar a la luz insights, recordar decisiones y comprender la dinámica cambiante de los equipos.
Un stack de IA flexible y multimodelo
Para complementar esta infraestructura, Tanka utiliza una estrategia de LLM flexible y multimodelo. El sistema se basa principalmente en Gemini 2 Flash y Claude 3.7 Sonnet para razonamiento y resumir contenido, con modelos de OpenAI aplicados selectivamente para tareas con muchas instrucciones. Para evitar límites de tasa y garantizar un rendimiento resiliente entre proveedores, Tanka utiliza OpenRouter para gestionar el acceso a la API y el enrutamiento.
Beneficios y resultados: impacto empresarial transformacional
Asociarse con Zilliz Cloud no solo resolvió los puntos débiles técnicos de Tanka: redefinió la trayectoria de la empresa. Con la infraestructura estabilizada y el rendimiento optimizado, el equipo finalmente pudo cambiar su enfoque de la extinción operativa de incendios a la innovación en IA. Los beneficios alcanzaron todos los niveles de la organización, desbloqueando nuevos niveles de velocidad, fiabilidad y escala.
Alivio operativo inmediato
El impacto más inmediato —y dramático— fue la eliminación de los problemas de producción relacionados con la inestabilidad de la infraestructura. Antes de migrar a Zilliz Cloud, los incidentes relacionados con la base de datos ocasionalmente interrumpían el servicio y comprometían la confianza de los usuarios. Ese ya no es el caso.
“Después de pasar a Zilliz Cloud, básicamente eliminamos los problemas de producción relacionados con fallos de la base de datos”, dice Wu Junjie, arquitecto de IA en Tanka. “Solíamos tener incidentes ocasionales que afectaban a los usuarios. Ahora, esos problemas han desaparecido.”
Esta mejora fue crítica para una plataforma construida sobre la promesa de una memoria organizacional persistente. Como la fiabilidad de la base de datos ya no era una preocupación, los usuarios podían depender de un acceso rápido e ininterrumpido a su conocimiento acumulado, día tras día.
Reenfocar la ingeniería en la innovación
Con las preocupaciones de infraestructura superadas, el equipo de ingeniería de Tanka pudo reasignar su tiempo al desarrollo de producto y la innovación. En lugar de encargarse de failovers, copias de seguridad y alertas, los ingenieros pudieron centrarse en crear las funcionalidades que definen la ventaja competitiva de Tanka.
“El rendimiento y la fiabilidad de Zilliz cumplen plenamente con nuestros requisitos de RAG”, dice Wu Junjie. “Eso nos permite enfocar nuestros esfuerzos técnicos en construir capacidades diferenciadas de memoria de IA, donde reside nuestro verdadero valor.”
El cambio condujo a ciclos de iteración más rápidos, lanzamientos de funcionalidades más ambiciosos y una alineación más estrecha entre el esfuerzo de ingeniería y la estrategia empresarial.
Rendimiento constante a escala masiva
A medida que creció la base de usuarios de Tanka, también lo hicieron las demandas sobre su backend. El sistema ahora maneja miles de operaciones de búsqueda vectorial concurrentes por segundo durante los momentos pico, extrayendo información de más de tres años de datos organizacionales que abarcan millones de mensajes, documentos y eventos.
Esta consistencia de rendimiento ha eliminado los límites de infraestructura como factor en la planificación de producto. El equipo de Tanka ahora puede construir y escalar sin dudar, sabiendo que su backend estará a la altura.
Conclusión
El recorrido de Tanka —desde los desafíos iniciales de infraestructura hasta el éxito en producción con Zilliz Cloud— destaca una lección poderosa: la base adecuada de base de datos vectorial no solo mejora el rendimiento; desbloquea la innovación.
Al asociarse con Zilliz Cloud, Tanka eliminó los incidentes en producción, aumentó la productividad de ingeniería y logró un rendimiento consistente a escala. Más importante aún, el cambio permitió a Tanka enfocarse por completo en su misión principal: construir capacidades de memoria de próxima generación para AI Assistants que van mucho más allá de la recuperación básica.
Para las empresas de IA que desarrollan aplicaciones intensivas en memoria, la experiencia de Tanka muestra cómo las decisiones de infraestructura impactan directamente en la velocidad de innovación y el éxito del producto. El rendimiento, la fiabilidad y la simplicidad operativa no son solo requisitos técnicos: son habilitadores estratégicos.
Con la base adecuada en su lugar, Tanka ha transformado su ambiciosa visión en una realidad líder en el mercado, demostrando que cuando la infraestructura empodera en lugar de imponer limitaciones, la IA revolucionaria no solo es posible, sino inevitable.
- Acerca de Tanka
- El desafío de la comprensión semántica: cuando la búsqueda por palabras clave no es suficiente
- La solución: escalar la memoria con rendimiento y fiabilidad
- La implementación: potenciando la memoria avanzada de IA con Zilliz Cloud
- Beneficios y resultados: impacto empresarial transformacional
- Conclusión
Contenido
Industria


