C12.ai accélère la découverte de médicaments avec la base de données vectorielle Milvus

Recherches 10× plus rapides
Récupération instantanée des réactions, réduisant le temps de requête de quelques minutes à quelques secondes.
Évolutivité transparente
Gère sans effort des millions de réactions et des charges de travail croissantes.
Pertinence supérieure
Fournit des suggestions de réactions de haute qualité et chimiquement pratiques.
Expérience utilisateur améliorée
Adoption de la plateforme renforcée grâce à une rétrosynthèse plus rapide et plus intelligente.
À propos de C12.ai
Fondée en 2022, C12.ai transforme les laboratoires de recherche et développement pharmaceutiques en combinant une IA de pointe avec des technologies d’intelligence incarnée. Sa mission est d’aider les laboratoires à dépasser l’automatisation traditionnelle, en intégrant une prise de décision intelligente dans les flux de travail de laboratoire afin de réduire les goulets d’étranglement manuels, d’améliorer l’efficacité et de diminuer les coûts opérationnels. Grâce à des innovations telles que les insights en temps réel et une automatisation plus intelligente, C12.ai ouvre la voie à une nouvelle ère de R&D pharmaceutique intelligente.
Un axe central de C12.ai est l’analyse rétrosynthétique — une technique essentielle dans le développement de médicaments et la chimie de synthèse organique. En déconstruisant des molécules complexes en précurseurs plus simples et en concevant des voies de synthèse, les chimistes peuvent accélérer la découverte de nouveaux médicaments. C12.ai améliore ce processus en exploitant les données historiques de réactions chimiques et des systèmes de recherche intelligents afin de faciliter une planification de synthèse plus rapide et plus efficace.
Le défi : conception de voies rétrosynthétiques complexes
Dans la conception de voies rétrosynthétiques, C12.ai a été confrontée à plusieurs défis majeurs :
1. Gérer d’immenses bases de données de réactions
Les bases de données de chimie contiennent des dizaines ou des centaines de millions d’enregistrements de réactions. Trouver les quelques précédents les plus pertinents pour une transformation spécifique nécessite des capacités de recherche sophistiquées que les bases de données traditionnelles ne peuvent tout simplement pas fournir.
2. Calculer efficacement des recherches de similarité en haute dimension
Les techniques modernes d’empreintes chimiques, telles que les Extended Connectivity Fingerprints (ECFP), traduisent les structures moléculaires en vecteurs de haute dimension comportant des centaines ou des milliers de dimensions. Les systèmes de bases de données traditionnels ne disposent pas de l’indexation spécialisée nécessaire pour calculer les similarités entre ces vecteurs complexes à grande échelle.
3. Permettre une conception interactive en temps réel
Une conception rétrosynthétique efficace est un processus itératif et interactif. Les chimistes doivent pouvoir explorer rapidement plusieurs voies, évaluer des alternatives et recevoir un retour immédiat sur chaque voie proposée. Cela exige un système capable de fournir systématiquement des temps de réponse inférieurs à la seconde.
4. Garantir la pertinence et la praticité chimiques
La similarité purement mathématique ne suffit pas : les réactions récupérées doivent correspondre à des propriétés chimiques et à des conditions de réaction spécifiques pour être réellement utiles. Le système doit combiner les recherches de similarité brutes avec des règles expertes sur les mécanismes, les rendements et l’applicabilité pratique.
Pour fournir une plateforme capable de prendre en charge une conception rétrosynthétique en temps réel, évolutive et hautement précise, C12.ai avait besoin d’un nouveau type de solution.
La solution : recherche vectorielle avec Milvus
Après avoir évalué plusieurs options, C12.ai a choisi Milvus comme fondation de son moteur de recherche de réactions similaires. Ce choix a été motivé par plusieurs avantages clés qui rendent Milvus particulièrement adapté à la recherche de similarité chimique :
Pourquoi C12.ai a choisi Milvus
Recherche vectorielle ultra-rapide et précise : Milvus utilise des techniques d’indexation de pointe, notamment IVF et HNSW, qui partitionnent l’espace vectoriel et appliquent la quantification afin de réduire considérablement les latences de recherche. Cette architecture permet des temps de réponse de l’ordre de la milliseconde sur des collections contenant des centaines de millions de vecteurs, précisément ce qui est nécessaire pour une conception rétrosynthétique interactive.
Architecture distribuée et élastique : Déployé dans des conteneurs sur Kubernetes, Milvus s’adapte horizontalement avec facilité. Les données sont automatiquement partitionnées et répliquées entre les nœuds, offrant à la fois une évolutivité des performances et une haute disponibilité. Cette infrastructure s’adapte dynamiquement à l’évolution des charges de travail et à la croissance des ensembles de données.
Intégration transparente dans les systèmes existants : Avec des SDK complets pour Python, Java et d’autres langages, Milvus s’intègre harmonieusement aux flux de travail de cheminformatique existants de C12.ai. Cela a permis à l’équipe de mettre en œuvre une recherche vectorielle avancée sans reconstruire l’ensemble de sa pile technologique.
Mise à l’échelle rentable : En optimisant l’utilisation des ressources et en prenant en charge la mise à l’échelle dynamique, Milvus réduit considérablement les coûts d’infrastructure par rapport aux solutions de bases de données monolithiques ou traditionnelles — un élément important pour traiter le volume toujours croissant de données de réactions chimiques.
Comment Milvus alimente la plateforme de C12.ai
C12.ai a mis en œuvre un workflow complet qui exploite Milvus à chaque étape de la récupération de réactions similaires.
1. Vectorisation des données de réactions chimiques
Chaque réaction de la base de données de C12.ai est encodée en embeddings vectoriels de haute dimension à l’aide d’algorithmes spécialisés d’empreintes chimiques. Ces embeddings capturent les caractéristiques essentielles des réactifs, produits, catalyseurs, solvants et conditions de réaction, créant une représentation mathématique pouvant être traitée efficacement par Milvus.
2. Création d’index de recherche optimisés
L’implémentation utilise la structure IVF (Inverted File Index) de Milvus, qui partitionne l’espace vectoriel en clusters et utilise des centroïdes quantifiés pour approximer les points de données. Cette approche accélère considérablement les performances de recherche en limitant la portée des comparaisons exactes aux clusters les plus prometteurs.
3. Répartition des charges de travail pour l’échelle et la résilience
Le déploiement Milvus de C12.ai s’exécute sur un cluster basé sur Kubernetes, permettant le traitement parallèle sur plusieurs nœuds de calcul. Cette architecture conteneurisée évolue horizontalement de manière transparente sous de fortes charges et offre une tolérance aux pannes robuste grâce à la réplication automatique et au basculement.
4. Amélioration des résultats avec des filtres spécifiques au domaine
Les résultats bruts de similarité vectorielle sont ensuite affinés grâce aux règles propriétaires de connaissances chimiques de C12.ai. Les réactions récupérées sont notées en fonction de la compatibilité des conditions, des rendements rapportés et de l’applicabilité pratique dans des contextes de synthèse. Cette approche hybride garantit que les chimistes reçoivent non seulement des réactions structurellement similaires, mais aussi des réactions réellement utiles pour leurs défis synthétiques spécifiques.
Aperçu du workflow
Comme le montre le diagramme ci-dessous, le système comporte deux workflows parallèles : l’un pour préparer la bibliothèque de réactions, et l’autre pour le traitement des requêtes en temps réel.
Comment Milvus alimente la plateforme de C12.ai
Workflow 1 : Préparation et vectorisation de la bibliothèque de réactions : C12.ai traite d’abord l’ensemble de sa base de données de réactions chimiques en vectorisant chaque équation de réaction, capturant les caractéristiques moléculaires essentielles telles que les réactifs, les catalyseurs, les solvants et les conditions. Ces vecteurs sont ensuite importés dans Milvus, où des index efficaces comme IVF sont construits. Cette étape de préparation garantit que des millions de réactions peuvent être recherchées rapidement et avec précision lorsque nécessaire.
Workflow 2 : Traitement des requêtes en temps réel : Lorsqu’une réaction cible est saisie, le système vectorise l’entrée dans le même format et effectue une recherche de similarité dans Milvus afin de récupérer les top-K réactions les plus proches. Les résultats initiaux sont ensuite réordonnés au moyen de règles spécifiques au domaine, en tenant compte des conditions de réaction, des rendements et de l’applicabilité pratique. Après le réordonnancement, le système récupère les informations détaillées et présente aux chimistes des options de synthèse de haute qualité, exploitables en temps réel.
Résultats et avantages de l’implémentation
Depuis l’intégration de Milvus dans leur plateforme de conception rétrosynthétique, C12.ai a réalisé des améliorations remarquables sur plusieurs dimensions :
Récupération 10× plus rapide
Les temps de recherche ont été réduits de quelques minutes à quelques secondes, même lors de l’interrogation de bases de données contenant des millions d’entrées de réactions. Cette amélioration spectaculaire de la vitesse permet des workflows de conception véritablement interactifs, où les chimistes peuvent itérer rapidement sur des voies de synthèse.
Scalabilité transparente
Le déploiement distribué de Milvus s’adapte facilement à l’augmentation des volumes de données et aux pics de charge des requêtes. Alors que C12.ai enrichit continuellement ses bases de données de réactions avec de nouvelles publications et données expérimentales, le système maintient des performances constantes sans nécessiter de changements architecturaux majeurs.
Pertinence supérieure des résultats
En combinant la recherche vectorielle avec un filtrage propre au domaine chimique, la plateforme fournit des suggestions qui s’alignent à la fois structurellement et contextuellement avec les transformations cibles. Cette pertinence accrue se traduit directement par des synthèses plus réussies et moins d’expériences échouées en laboratoire.
Expérience utilisateur améliorée
La combinaison de temps de réponse rapides et de correspondances de haute qualité a considérablement amélioré la satisfaction des utilisateurs. Les chimistes peuvent désormais explorer plus en profondeur les options de synthèse et prendre des décisions avec plus de confiance, rationalisant ainsi l’ensemble du processus de développement de médicaments.
Conclusion
Le partenariat entre C12.ai et Milvus démontre comment une technologie spécialisée de base de données vectorielle peut transformer des flux de travail scientifiques complexes. En relevant le double défi de l’échelle massive des données et du calcul en haute dimension, Milvus a permis à C12.ai de créer une plateforme de conception rétrosynthétique offrant une vitesse, une précision et une facilité d’utilisation sans précédent.
Pour les entreprises pharmaceutiques confrontées à une forte pression pour réduire les délais et les coûts de développement, cette technologie offre un avantage concurrentiel puissant — leur permettant de concevoir des synthèses plus efficaces, d’explorer un espace chimique plus vaste et, au final, de mettre plus rapidement sur le marché des médicaments qui sauvent des vies.


