C12.ai accelera la scoperta di farmaci con il database vettoriale Milvus

Ricerche 10 volte più veloci
Recupero istantaneo delle reazioni, riducendo il tempo di query da minuti a secondi.
Scalabilità perfetta
Gestisce senza sforzo milioni di reazioni e carichi di lavoro in crescita.
Pertinenza superiore
Fornisce suggerimenti di reazione di alta qualità e chimicamente pratici.
Esperienza utente migliorata
Adozione della piattaforma potenziata con una retrosintesi più rapida e intelligente.
Informazioni su C12.ai
Fondata nel 2022, C12.ai sta trasformando i laboratori di ricerca e sviluppo farmaceutico combinando l'AI all'avanguardia con tecnologie di intelligenza incarnata. La sua missione è aiutare i laboratori ad andare oltre l'automazione tradizionale, integrando il processo decisionale intelligente nei flussi di lavoro di laboratorio per ridurre i colli di bottiglia manuali, migliorare l'efficienza e abbassare i costi operativi. Attraverso innovazioni come insight in tempo reale e un'automazione più intelligente, C12.ai sta guidando una nuova era di R&D farmaceutica intelligente.
Un focus centrale di C12.ai è l'analisi retrosintetica—una tecnica critica nello sviluppo di farmaci e nella chimica di sintesi organica. Scomponendo molecole complesse in precursori più semplici e progettando percorsi sintetici, i chimici possono accelerare la scoperta di nuovi farmaci. C12.ai potenzia questo processo sfruttando dati storici sulle reazioni chimiche e sistemi di recupero intelligenti per facilitare una pianificazione della sintesi più rapida ed efficace.
La sfida: progettazione di percorsi retrosintetici complessi
Nella progettazione di percorsi retrosintetici, C12.ai ha affrontato diverse sfide chiave:
1. Gestire enormi database di reazioni
I database di chimica contengono decine o centinaia di milioni di record di reazioni. Trovare la manciata di precedenti più rilevanti per una trasformazione specifica richiede capacità di ricerca sofisticate che i database tradizionali semplicemente non possono offrire.
2. Calcolare in modo efficiente ricerche di similarità ad alta dimensionalità
Le moderne tecniche di fingerprinting chimico, come gli Extended Connectivity Fingerprints (ECFP), traducono le strutture molecolari in vettori ad alta dimensionalità con centinaia o migliaia di dimensioni. I sistemi di database tradizionali non dispongono dell'indicizzazione specializzata necessaria per calcolare le similarità tra questi vettori complessi su larga scala.
3. Abilitare la progettazione interattiva in tempo reale
Una progettazione retrosintetica efficace è un processo iterativo e interattivo. I chimici devono esplorare rapidamente molteplici percorsi, valutare alternative e ricevere feedback immediato su ogni percorso proposto. Ciò richiede un sistema in grado di fornire costantemente tempi di risposta inferiori al secondo.
4. Garantire rilevanza chimica e praticità
La pura similarità matematica non è sufficiente: le reazioni recuperate devono allinearsi con proprietà chimiche e condizioni di reazione specifiche per essere davvero utili. Il sistema deve combinare ricerche di similarità grezze con regole esperte su meccanismi, rese e applicabilità pratica.
Per offrire una piattaforma in grado di supportare una progettazione retrosintetica in tempo reale, scalabile e altamente accurata, C12.ai aveva bisogno di un nuovo tipo di soluzione.
La soluzione: ricerca vettoriale con Milvus
Dopo aver valutato diverse opzioni, C12.ai ha scelto Milvus come base per il proprio motore di ricerca di reazioni simili. Questa scelta è stata guidata da diversi vantaggi chiave che rendono Milvus particolarmente adatto alla ricerca di similarità chimica:
Perché C12.ai ha scelto Milvus
Ricerca vettoriale ultra-rapida e accurata: Milvus utilizza tecniche di indicizzazione all'avanguardia, tra cui IVF e HNSW, che partizionano lo spazio vettoriale e applicano la quantizzazione per ridurre significativamente le latenze di ricerca. Questa architettura consente tempi di risposta dell'ordine dei millisecondi su raccolte contenenti centinaia di milioni di vettori, esattamente ciò che serve per la progettazione retrosintetica interattiva.
Architettura elastica e distribuita: Distribuito in container su Kubernetes, Milvus scala orizzontalmente con facilità. I dati vengono automaticamente frammentati e replicati tra i nodi, offrendo sia scalabilità delle prestazioni sia alta disponibilità. Questa infrastruttura si adatta dinamicamente ai carichi di lavoro variabili e ai dataset in crescita.
Integrazione fluida nei sistemi esistenti: Con SDK completi per Python, Java e altri linguaggi, Milvus si integra senza problemi nei flussi di lavoro cheminformatici esistenti di C12.ai. Ciò ha permesso al team di implementare una ricerca vettoriale avanzata senza ricostruire l'intero stack tecnologico.
Scalabilità conveniente: Ottimizzando l’utilizzo delle risorse e supportando la scalabilità dinamica, Milvus riduce significativamente i costi infrastrutturali rispetto alle soluzioni di database monolitiche o tradizionali: un aspetto importante per elaborare il volume in continua crescita dei dati sulle reazioni chimiche.
Come Milvus alimenta la piattaforma di C12.ai
C12.ai ha implementato un workflow completo che sfrutta Milvus in ogni fase del recupero di reazioni simili.
1. Vettorializzazione dei dati sulle reazioni chimiche
Ogni reazione nel database di C12.ai viene codificata in embedding vettoriali ad alta dimensionalità utilizzando algoritmi specializzati di fingerprinting chimico. Questi embedding catturano le caratteristiche essenziali di reagenti, prodotti, catalizzatori, solventi e condizioni di reazione, creando una rappresentazione matematica che può essere elaborata in modo efficiente da Milvus.
2. Creazione di indici di ricerca ottimizzati
L’implementazione utilizza la struttura IVF (Inverted File Index) di Milvus, che partiziona lo spazio vettoriale in cluster e utilizza centroidi quantizzati per approssimare i punti dati. Questo approccio accelera drasticamente le prestazioni di ricerca limitando l’ambito dei confronti esatti ai cluster più promettenti.
3. Distribuzione dei workload per scalabilità e resilienza
Il deployment di Milvus di C12.ai viene eseguito su un cluster basato su Kubernetes, consentendo l’elaborazione parallela su più nodi di calcolo. Questa architettura containerizzata scala orizzontalmente senza interruzioni sotto carichi elevati e offre una solida tolleranza ai guasti tramite replica automatica e failover.
4. Miglioramento dei risultati con filtri specifici del dominio
I risultati grezzi di similarità vettoriale vengono ulteriormente perfezionati tramite le regole proprietarie di conoscenza chimica di C12.ai. Le reazioni recuperate vengono valutate in base alla compatibilità delle condizioni, alle rese riportate e all’applicabilità pratica in contesti di sintesi. Questo approccio ibrido garantisce che i chimici ricevano non solo reazioni strutturalmente simili, ma reazioni realmente utili per le loro specifiche sfide sintetiche.
Panoramica del workflow
Come mostrato nel diagramma seguente, nel sistema sono presenti due workflow paralleli: uno per preparare la libreria di reazioni e un altro per l’elaborazione delle query in tempo reale.
Come Milvus alimenta la piattaforma di C12.ai
Workflow 1: Preparazione e vettorializzazione della libreria di reazioni: C12.ai elabora innanzitutto il suo intero database di reazioni chimiche vettorializzando ogni equazione di reazione, catturando caratteristiche molecolari essenziali come reagenti, catalizzatori, solventi e condizioni. Questi vettori vengono quindi importati in Milvus, dove vengono creati indici efficienti come IVF. Questa fase di preparazione garantisce che milioni di reazioni possano essere ricercate rapidamente e accuratamente quando necessario.
Workflow 2: Elaborazione delle query in tempo reale: Quando viene inserita una reazione target, il sistema vettorializza l’input nello stesso formato ed esegue una ricerca di similarità in Milvus per recuperare le top-K reazioni più vicine. I risultati iniziali vengono quindi riordinati tramite regole specifiche del dominio, considerando condizioni di reazione, rese e applicabilità pratica. Dopo il riordinamento, il sistema recupera informazioni dettagliate e presenta ai chimici opzioni di sintesi di alta qualità e attuabili in tempo reale.
Risultati e vantaggi dell’implementazione
Da quando ha integrato Milvus nella propria piattaforma di progettazione retrosintetica, C12.ai ha ottenuto notevoli miglioramenti su più dimensioni:
Recupero 10× più veloce
I tempi di ricerca sono stati ridotti da minuti a secondi, anche quando si interrogano database contenenti milioni di voci di reazione. Questo drastico miglioramento della velocità consente workflow di progettazione realmente interattivi, in cui i chimici possono iterare rapidamente sui percorsi sintetici.
Scalabilità senza interruzioni
La distribuzione distribuita di Milvus si adatta facilmente a volumi di dati in crescita e a picchi di carico delle query. Man mano che C12.ai espande continuamente i propri database di reazioni con nuova letteratura e dati sperimentali, il sistema mantiene prestazioni costanti senza richiedere importanti modifiche architetturali.
Rilevanza superiore dei risultati
Combinando la ricerca vettoriale con il filtraggio specifico del dominio chimico, la piattaforma fornisce suggerimenti che si allineano sia strutturalmente sia contestualmente con le trasformazioni target. Questa maggiore rilevanza si traduce direttamente in sintesi più riuscite e in un minor numero di esperimenti falliti in laboratorio.
Esperienza utente migliorata
La combinazione di tempi di risposta rapidi e corrispondenze di alta qualità ha migliorato significativamente la soddisfazione degli utenti. I chimici possono ora esplorare le opzioni sintetiche in modo più approfondito e prendere decisioni con maggiore sicurezza, snellendo l’intero processo di sviluppo dei farmaci.
Conclusione
La partnership tra C12.ai e Milvus dimostra come una tecnologia specializzata di database vettoriale possa trasformare flussi di lavoro scientifici complessi. Affrontando la doppia sfida dell’enorme scala dei dati e del calcolo ad alta dimensionalità, Milvus ha permesso a C12.ai di costruire una piattaforma di progettazione retrosintetica che offre velocità, accuratezza e usabilità senza precedenti.
Per le aziende farmaceutiche sottoposte a un’intensa pressione per ridurre tempi e costi di sviluppo, questa tecnologia offre un potente vantaggio competitivo, consentendo loro di progettare sintesi più efficienti, esplorare uno spazio chimico più ampio e, in ultima analisi, portare sul mercato più rapidamente farmaci salvavita.


