C12.ai、Milvusベクターデータベースで創薬を加速

10倍速い検索
瞬時の反応検索により、クエリー時間を数分から数秒に短縮。
シームレスなスケーラビリティ
何百万もの反応や増大するワークロードを難なく処理。
優れた関連性
高品質で化学的に実用的な反応提案を提供。
ユーザー・エクスペリエンスの向上
より迅速でスマートなレトロシンセシスにより、プラットフォームの普及を促進。
#C12.aiについて
2022年に設立されたC12.aiは、最先端のAIと具現化された知能技術を組み合わせることにより、製薬研究開発ラボを変革している。同社のミッションは、ラボが従来の自動化を超えて、インテリジェントな意思決定をラボのワークフローに組み込み、手作業のボトルネックを減らし、効率を高め、運用コストを下げることを支援することである。リアルタイムの洞察やよりインテリジェントな自動化などのイノベーションを通じて、C12.aiはインテリジェントな医薬品研究開発の新時代をリードしています。
C12.aiは、医薬品開発と有機合成化学における重要な技術であるレトロシンセティック分析に重点を置いています。複雑な分子をより単純な前駆体に分解し、合成経路を設計することで、化学者は新薬の発見を加速することができます。C12.aiは、過去の化学反応データとインテリジェントな検索システムを活用してこのプロセスを強化し、より迅速で効果的な合成計画を促進します。
課題複雑な逆合成経路の設計
逆合成ルート設計において、C12.aiはいくつかの重要な課題に直面した:
1.膨大な反応データベースの管理
化学データベースには数千万から数億の反応記録があります。特定の変換に最も関連する一握りの先例を見つけるには、従来のデータベースでは提供できなかった高度な検索機能が必要です。
2.高次元類似検索の効率的な計算
Extended Connectivity Fingerprints(ECFP)のような最新の化学フィンガープリンティング技術は、分子構造を数百から数千次元の高次元ベクトルに変換する。従来のデータベースシステムには、このような複雑なベクトル間の類似性をスケールで計算するために必要な特殊なインデックスがありません。
3.リアルタイム・インタラクティブ・デザインの実現
効果的な逆合成デザインは、反復的でインタラクティブなプロセスである。化学者は、複数の経路を迅速に探索し、代替案を評価し、提案された各経路について即座にフィードバックを受ける必要があります。これには、秒以下の応答時間を一貫して提供できるシステムが必要です。
4.化学的妥当性と実用性の確保
純粋な数学的類似性だけでは十分ではない。真に有用であるためには、検索された反応が特定の化学的特性と反応条件に合致していなければならない。システムは、生の類似性検索と、メカニズム、収率、実用的な適用性に関する専門家のルールをブレンドしなければならない。
リアルタイムでスケーラブルかつ高精度な逆合成設計をサポートするプラットフォームを提供するために、C12.aiは新しいソリューションを必要としていた。
解決策Milvusによるベクトル検索
いくつかのオプションを評価した後、C12.aiは類似反応検索エンジンの基盤としてMilvusを選択した。この選択は、Milvusが化学的類似性検索に特に適しているいくつかの重要な利点によって決定されました:
C12.aiがMilvusを選んだ理由
超高速で正確なベクトル検索: MilvusはIVFやHNSWを含む最先端のインデックス作成技術を利用しており、ベクトル空間を分割し、量子化を適用することで検索レイテンシを大幅に削減します。このアーキテクチャにより、何億ものベクトルを含むコレクションに対してミリ秒レベルの応答時間を実現し、まさに対話的な逆合成設計に必要なものとなっています。
**Kubernetes上のコンテナで展開されるMilvusは、容易に水平方向にスケールします。データは自動的にシャード化され、ノード間でレプリケートされるため、パフォーマンスのスケーラビリティと高可用性の両方を提供します。このインフラストラクチャは、ワークロードの変化やデータセットの増大に動的に適応します。
既存システムへのシームレスな統合: Python、Java、その他の言語用の包括的なSDKにより、MilvusはC12.aiの既存のケムインフォマティクスワークフローにスムーズに統合されます。これにより、チームは技術スタック全体を再構築することなく、高度なベクトル検索を実装することができました。
**リソースの利用を最適化し、動的なスケーリングをサポートすることで、Milvusはモノリシックなデータベースや従来のデータベースソリューションに比べてインフラコストを大幅に削減します。
C12.aiのプラットフォームを支えるMilvusの仕組み
C12.aiは類似反応検索のあらゆる段階でMilvusを活用した包括的なワークフローを実装しています。
**1.化学反応データのベクトル化
C12.aiのデータベース内の各反応は、特殊な化学フィンガープリンティング・アルゴリズムを用いて高次元のベクトル埋め込みにエンコードされます。これらの埋め込みは、反応物、生成物、触媒、溶媒、反応条件の本質的な特徴を捉え、Milvusで効率的に処理できる数学的表現を作成します。
**2.最適化された検索インデックスの構築
ベクトル空間をクラスタに分割し、量子化されたセントロイドを使用してデータポイントを近似するMilvusのIVF(Inverted File Index)構造を利用しています。このアプローチは、厳密な比較の範囲を最も有望なクラスタに限定することで、検索性能を劇的に加速する。
3.スケールと耐障害性のためにワークロードを分散する。
C12.aiのMilvusデプロイはKubernetesベースのクラスタ上で実行され、複数のコンピュートノードで並列処理が可能です。このコンテナ化されたアーキテクチャは、高負荷下でもシームレスにスケールアウトし、自動レプリケーションとフェイルオーバーによる堅牢なフォールトトレランスを提供します。
4.ドメイン固有のフィルターで結果を強化する。
C12.ai独自の化学知識ルールにより、生ベクトルの類似性結果がさらに洗練されます。取得された反応は、条件適合性、報告された収率、合成文脈における実用的な適用性に基づいてスコアリングされます。このハイブリッドなアプローチにより、化学者は構造的に類似した反応だけでなく、特定の合成課題に対して真に有用な反応を得ることができます。
ワークフローの概要
下図に示すように、システムには2つの並列ワークフローがあります。1つは反応ライブラリーの準備、もう1つはリアルタイムのクエリー処理です。
MilvusがC12.aiのプラットフォームをどのように支えているか](https://assets.zilliz.com/WX_20250426_212734_2x_92fd0f59cd.png)
ワークフロー1: 反応ライブラリの準備とベクトル化: C12.aiはまず、各反応式をベクトル化することで化学反応データベース全体を処理し、反応物、触媒、溶媒、条件などの本質的な分子特徴をキャプチャします。これらのベクターはMilvusにインポートされ、IVFのような効率的なインデックスが構築されます。この準備段階により、何百万もの反応を必要な時に迅速かつ正確に検索できるようになります。
ワークフロー2: リアルタイムクエリー処理: ターゲット反応が入力されると、システムは同じフォーマットで入力をベクトル化し、Milvusで類似性検索を行い、上位K個の最も近い反応を検索する。最初の結果は、反応条件、収率、実用性を考慮したドメイン特有のルールによって再ランク付けされる。再ランク付け後、システムは詳細情報を取得し、化学者に高品質で実用的な合成オプションをリアルタイムで提示する。
##実施結果と利点
C12.aiはMilvusを逆合成デザインプラットフォームに統合して以来、多方面にわたって目覚ましい改善を達成している:
10倍速い検索
数百万の反応エントリーを含むデータベースへのクエリでも、検索時間は数分から数秒に短縮されました。この劇的なスピードアップにより、化学者が合成ルートを迅速に反復できる、真にインタラクティブな設計ワークフローが可能になりました。
シームレスなスケーラビリティ
Milvusの分散配置は、データ量の増大やクエリ負荷のピークに容易に対応します。C12.aiが新しい文献や実験データで反応データベースを継続的に拡張しても、システムはアーキテクチャを大きく変更することなく一貫したパフォーマンスを維持します。
優れた結果の関連性
ベクトル検索と化学ドメインフィルタリングを組み合わせることで、このプラットフォームは構造的にも文脈的にもターゲットの変換と一致する提案を提供します。この高い関連性は、合成の成功率を高め、ラボでの実験の失敗を減らすことに直結します。
ユーザーエクスペリエンスの向上
迅速な応答時間と高品質なマッチングの組み合わせにより、ユーザーの満足度が大幅に向上しました。化学者は、合成の選択肢をより徹底的に検討し、より確信を持って決定を下すことができるようになり、医薬品開発プロセス全体が効率化されました。
結論
C12.aiとMilvusのパートナーシップは、特殊なベクトルデータベース技術がいかに複雑な科学ワークフローを変革できるかを示している。膨大なデータスケールと高次元計算という2つの課題に取り組むことで、MilvusはC12.aiがかつてないスピード、精度、ユーザビリティを実現する逆合成デザインプラットフォームを構築することを可能にした。
開発期間とコストの削減という強いプレッシャーに直面している製薬企業にとって、このテクノロジーは強力な競争優位性を提供します。つまり、より効率的な合成を設計し、より多くの化学的空間を探索し、最終的には救命薬をより早く市場に投入することを可能にします。
ユースケース
産業
医療サービス


