Créer des agents d’IA à grande échelle : comment Tanka a tiré parti de Zilliz Cloud pour une communication d’entreprise intelligente

0 problèmes de production
lié à l’instabilité de l’infrastructure
Des milliers de Vector Search
par seconde pendant les périodes de pointe
Moteur de mémoire sémantique
Comprendre les concepts et les relations à travers les outils et le temps
100 % de la capacité de l’équipe
redirigé vers l’innovation en IA
À propos de Tanka
Tanka est une plateforme d’agents d’entreprise conçue pour agir comme votre cofondateur IA. Conçu pour le lieu de travail moderne, Tanka aide les équipes de startups à naviguer dans le chaos des messages dispersés, des livrables désordonnés et des tâches répétitives. Grâce à sa mémoire à long terme unique, Tanka capture et relie les conversations à travers des outils comme Slack, Gmail, Notion, et bien d’autres, transformant une communication fragmentée en connaissance organisationnelle partagée.
En fournissant des réponses conscientes du contexte, en résumant les réunions et en envoyant des rappels de tâches au bon moment, Tanka renforce la productivité des équipes et la prise de décision. Depuis le lancement de sa bêta en 2024, Tanka a été adopté par plus de 1 000 équipes et a fourni plus de 35 000 réponses générées par l’IA.
Le défi de la compréhension sémantique : quand la recherche par mots-clés ne suffit pas
L’adoption rapide de Tanka a validé sa proposition de valeur fondamentale : permettre à des assistants IA qui ne se contentent pas de répondre — ils se souviennent, apprennent et comprennent le contexte métier au fil du temps. Mais faire passer cette vision à l’échelle s’est accompagné de défis techniques, d’autant plus que les utilisateurs attendaient davantage de la plateforme.
À ses débuts, l’équipe Tanka utilisait une récupération basée sur les mots-clés BM25 — un choix pragmatique qui lui a permis d’avancer rapidement et de prendre efficacement en charge les cas d’usage de recherche de base. Cela fonctionnait bien pour les requêtes simples et a aidé l’équipe à livrer rapidement un MVP fonctionnel.
Cependant, à mesure que la plateforme s’est étendue pour prendre en charge Outlook, Gmail, Slack, Telegram, Notion et d’autres outils, la complexité des modèles de données — et les attentes des utilisateurs — ont considérablement augmenté. Les équipes ne recherchaient plus des mots-clés isolés. Elles posaient des questions nuancées et contextuelles qui exigeaient du système qu’il comprenne les relations entre messages, réunions, documents et applications.
« Nous avons commencé par la recherche par mots-clés pour les requêtes simples », explique Wu Junjie, architecte IA chez Tanka. « Mais à mesure que les besoins de nos utilisateurs ont évolué, il est devenu clair qu’ils attendaient des réponses sémantiques — pas seulement des correspondances de chaînes. »
Cela a marqué le début d’un défi plus profond : combler le fossé sémantique entre ce que les utilisateurs voulaient dire et ce que les systèmes basés sur les mots-clés pouvaient fournir. Par exemple, les utilisateurs pouvaient demander un résumé de « ce qui a changé après le lancement du produit » ou les « suivis de la réunion commerciale de vendredi dernier » — des requêtes qui nécessitaient de croiser des e-mails, des discussions et des notes de réunion. Pour les humains, les liens étaient évidents. Pour le moteur de recherche, ils étaient invisibles.
Pendant ce temps, les enjeux montaient. Dans un espace concurrentiel où la rapidité et l’intelligence étaient des différenciateurs clés, l’infrastructure de recherche existante de Tanka a commencé à montrer des signes de tension. Les performances se sont dégradées à mesure que les volumes de données augmentaient. La latence de recherche a augmenté, en particulier pour les requêtes larges sans filtres clairs. Mais le problème le plus profond n’était pas la vitesse — c’était un désalignement stratégique.
L’équipe d’ingénierie s’est retrouvée embourbée dans la maintenance d’une infrastructure de recherche fragile au lieu de construire les fonctionnalités IA essentielles de sa feuille de route. Des capacités visionnaires — comme des insights multi-sources, des synthèses hebdomadaires intelligentes ou des suivis prédictifs — restaient tout juste hors de portée.
L’équipe Tanka a compris que la recherche par mots-clés les avait menés loin — mais pas assez loin. Pour débloquer la prochaine phase de leur vision produit, il leur fallait un système capable de véritablement comprendre l’intention utilisateur à travers le temps, les outils et le contexte.
La solution : faire évoluer la mémoire avec performance et fiabilité
Face à des défis techniques et opérationnels croissants, l’équipe Tanka s’est mise en quête d’une solution capable de soutenir sa feuille de route produit ambitieuse tout en offrant la fiabilité que les utilisateurs attendent d’un assistant IA doté d’une mémoire à long terme.
Évaluer les options de recherche vectorielle
Tanka a lancé un processus d’évaluation structuré et approfondi afin d’explorer des solutions potentielles. Parmi les premiers candidats figuraient PostgreSQL avec pgvector et des plugins Elasticsearch — séduisants au premier abord en raison de leur compatibilité avec leur stack existante. Mais les tests de performance ont rapidement révélé leurs limites, en particulier pour les charges de travail gourmandes en mémoire.
L’équipe a mené des comparaisons directes selon des critères clés : temps de réponse, débit, utilisation du CPU et évolutivité globale. Bien que la plupart des plateformes aient offert une précision similaire — les algorithmes de similarité vectorielle étant largement standardisés — Milvus s’est démarqué par sa vitesse supérieure et son efficacité en matière de ressources.
« Bien que la précision ait été comparable entre les plateformes, Milvus l’a clairement emporté en matière de vitesse et d’efficacité des ressources », déclare Wu Junjie, architecte IA chez Tanka.
Lors de l’évaluation, l’équipe a donné la priorité à :
La vitesse des requêtes, essentielle pour maintenir l’illusion d’une intelligence en temps réel ;
L’efficacité du CPU, afin de maintenir les coûts d’infrastructure soutenables à grande échelle ;
La fiabilité opérationnelle, essentielle pour instaurer la confiance dans un assistant axé sur la mémoire.
L’évolutivité, afin de prendre en charge la croissance rapide des volumes de données et des bases d’utilisateurs.
Du self-hosting à un service managé
Tanka a d’abord déployé Milvus en self-hosting en développement et en début de production. C’était le bon choix et cela a fourni la recherche vectorielle à faible latence dont leur produit avait besoin. Milvus a tenu sa promesse fondamentale : une recherche de similarité puissante et efficace à grande échelle.
Cependant, à mesure que la plateforme gagnait en maturité et que l’utilisation augmentait, la charge liée à la gestion de l’infrastructure a commencé à devenir une distraction. Exécuter et maintenir des clusters Milvus en interne signifiait que l’équipe d’ingénierie devait tout gérer, de la mise à l’échelle et du basculement à la surveillance et à la récupération.
Bien que le moteur Milvus lui-même soit resté fiable, les incidents liés à l’infrastructure — comme les défaillances de nœuds ou les problèmes réseau — introduisaient des risques et des temps d’arrêt qui avaient un impact direct sur l’expérience utilisateur.
Au fil du temps, le compromis est devenu clair : l’équipe devait se concentrer sur la création de fonctionnalités produit, et non sur la maintenance de l’infrastructure de base de données.
Migration vers Zilliz Cloud
Le choix de passer à Zilliz Cloud, la version entièrement managée de Milvus, s’est imposé clairement. Elle offrait le même cœur haute performance avec une fiabilité de niveau entreprise, sans les frais liés à la gestion de clusters en interne.
Pour une équipe agile et en mouvement rapide comme celle de Tanka, déléguer la complexité opérationnelle a changé la donne :
Plus besoin de gérer en urgence les problèmes d’infrastructure
Une disponibilité et une cohérence accrues pour les applications critiques pour la mémoire
Davantage de temps d’ingénierie à consacrer à l’innovation et à l’expérience utilisateur
Le service de migration intégré de Zilliz a rendu la transition fluide et peu risquée. Grâce à un support technique réactif et à une intégration S3 transparente, l’équipe Tanka est passée au cloud avec un minimum de perturbations.
La mise en œuvre : alimenter une mémoire IA avancée avec Zilliz Cloud
Avec une infrastructure fiable en place, Tanka a enfin pu réorienter son attention vers ce qui la distinguait vraiment : créer des capacités de mémoire avancées pour sa plateforme de messagerie AI-native, allant bien au-delà de la simple recherche. Alimentée par Zilliz Cloud, la mise en œuvre de Tanka est conçue pour prendre en charge des applications riches et sensibles au contexte, qui rendent les connaissances organisationnelles exploitables à grande échelle.
Au-delà de la récupération basique : mémoire sémantique à grande échelle
Au cœur du système de Tanka se trouve un pipeline de génération augmentée par récupération (RAG), permettant aux utilisateurs d’accéder à des informations pertinentes dans leurs outils de travail connectés, tels que Slack, Gmail et Notion. Cependant, contrairement aux systèmes RAG classiques qui récupèrent des documents sur la base d’une similarité superficielle, Tanka va plus loin.
Lors du prétraitement, Tanka effectue une extraction des entités et des relations afin de capturer des concepts de plus haut niveau à partir du contenu brut. Ils sont ensuite convertis en embeddings vectoriels et stockés dans Zilliz Cloud, permettant une récupération fondée non seulement sur ce qui a été dit, mais aussi sur la manière dont différentes idées, personnes et actions sont connectées.
Cela permet aux utilisateurs de poser des questions complexes et abstraites — comme « Quels étaient les principaux suivis issus de nos efforts de planification du T3 ? » — et de recevoir des réponses fondées sur des connaissances structurées plutôt que sur des correspondances de mots-clés.
Cette approche transforme Zilliz Cloud d’une couche de stockage en un moteur de mémoire sémantique, aidant l’assistant à comprendre le contexte, l’historique et les schémas à travers l’organisation.
Traitement en temps réel et mises à jour continues
Le système de Tanka ingère et traite les données des plateformes connectées en temps réel, garantissant que l’assistant IA reflète toujours l’état organisationnel le plus récent. À mesure que les équipes communiquent et collaborent, de nouveaux vecteurs sont générés et indexés dans Zilliz Cloud, ce qui maintient l’assistant à jour sans nécessiter d’intervention manuelle.
Le pipeline comprend :
L’ingestion multi-source depuis les e-mails, les chats et les documents
Le prétraitement pour l’extraction d’entités et de relations
L’intégration vectorielle et l’indexation dans Zilliz Cloud pour une récupération sémantique rapide
Cela permet à l’assistant IA d’agir comme une couche de mémoire vivante, aidant les utilisateurs à faire émerger des insights, à se souvenir des décisions et à comprendre l’évolution des dynamiques d’équipe.
Une pile IA flexible et multi-modèle
Pour compléter cette infrastructure, Tanka utilise une stratégie LLM flexible et multi-modèle. Le système s’appuie principalement sur Gemini 2 Flash et Claude 3.7 Sonnet pour le raisonnement et la synthèse, avec des modèles OpenAI appliqués de manière sélective pour les tâches exigeantes en instructions. Afin d’éviter les limitations de débit et de garantir des performances résilientes entre les fournisseurs, Tanka utilise OpenRouter pour gérer l’accès aux API et le routage.
Les bénéfices et résultats : un impact transformationnel sur l’entreprise
Le partenariat avec Zilliz Cloud n’a pas seulement résolu des points de douleur techniques pour Tanka : il a redéfini la trajectoire de l’entreprise. Une fois l’infrastructure stabilisée et les performances optimisées, l’équipe a enfin pu passer de la gestion opérationnelle des urgences à l’innovation en IA. Les bénéfices ont touché chaque niveau de l’organisation, débloquant de nouveaux niveaux de rapidité, de fiabilité et d’échelle.
Soulagement opérationnel immédiat
L’impact le plus immédiat — et spectaculaire — a été l’élimination des problèmes de production liés à l’instabilité de l’infrastructure. Avant la migration vers Zilliz Cloud, les incidents liés à la base de données perturbaient occasionnellement le service et compromettaient la confiance des utilisateurs. Ce n’est plus le cas.
« Après notre passage à Zilliz Cloud, nous avons pratiquement éliminé les problèmes de production liés aux défaillances de base de données », déclare Wu Junjie, AI Architect chez Tanka. « Nous avions auparavant des incidents occasionnels qui affectaient les utilisateurs. Aujourd’hui, ces problèmes ont disparu. »
Cette amélioration était essentielle pour une plateforme fondée sur la promesse d’une mémoire organisationnelle persistante. La fiabilité de la base de données n’étant plus un sujet de préoccupation, les utilisateurs pouvaient compter sur un accès rapide et ininterrompu à leurs connaissances accumulées, jour après jour.
Recentrer l’ingénierie sur l’innovation
Une fois les inquiétudes liées à l’infrastructure derrière elle, l’équipe d’ingénierie de Tanka a pu réallouer son temps au développement produit et à l’innovation. Au lieu de gérer les basculements, les sauvegardes et les alertes, les ingénieurs ont pu se concentrer sur la création des fonctionnalités qui définissent l’avantage concurrentiel de Tanka.
« Les performances et la fiabilité de Zilliz répondent pleinement à nos exigences RAG », déclare Wu Junjie. « Cela nous permet de concentrer nos efforts techniques sur la création de capacités de mémoire IA différenciées — là où réside notre véritable valeur. »
Ce changement a conduit à des cycles d’itération plus rapides, à des lancements de fonctionnalités plus ambitieux et à un alignement plus étroit entre les efforts d’ingénierie et la stratégie d’entreprise.
Performances constantes à très grande échelle
À mesure que la base d’utilisateurs de Tanka a grandi, les exigences envers son backend ont également augmenté. Le système gère désormais des milliers d’opérations de recherche vectorielle simultanées par seconde pendant les pics d’activité, en s’appuyant sur plus de trois ans de données organisationnelles couvrant des millions de messages, de documents et d’événements.
Cette constance des performances a supprimé les limites d’infrastructure comme facteur dans la planification produit. L’équipe de Tanka peut désormais construire et faire évoluer le produit sans hésitation, sachant que son backend suivra.
Conclusion
Le parcours de Tanka — des premiers défis d’infrastructure au succès en production avec Zilliz Cloud — met en lumière une leçon puissante : la bonne fondation de base de données vectorielle ne se contente pas d’améliorer les performances ; elle libère l’innovation.
En s’associant à Zilliz Cloud, Tanka a éliminé les incidents de production, accru la productivité de l’ingénierie et atteint des performances constantes à grande échelle. Plus important encore, ce changement a permis à Tanka de se concentrer entièrement sur sa mission principale : développer des capacités de mémoire de nouvelle génération pour les assistants IA, qui vont bien au-delà de la simple récupération.
Pour les entreprises d’IA développant des applications intensives en mémoire, l’expérience de Tanka montre comment les décisions d’infrastructure influencent directement la vitesse d’innovation et la réussite des produits. Les performances, la fiabilité et la simplicité opérationnelle ne sont pas seulement des exigences techniques : ce sont des leviers stratégiques.
Avec les bonnes fondations en place, Tanka a transformé sa vision ambitieuse en une réalité leader sur le marché, prouvant que lorsque l’infrastructure donne les moyens d’agir plutôt qu’elle ne contraint, l’IA de rupture n’est pas seulement possible, mais inévitable.
- À propos de Tanka
- Le défi de la compréhension sémantique : quand la recherche par mots-clés ne suffit pas
- La solution : faire évoluer la mémoire avec performance et fiabilité
- La mise en œuvre : alimenter une mémoire IA avancée avec Zilliz Cloud
- Les bénéfices et résultats : un impact transformationnel sur l’entreprise
- Conclusion
Contenu
Secteur d'activité


