TrialHub、Zilliz Cloudで臨床試験のインテリジェンスを強化

250M+
ベクター
高性能
規模に応じた検索
コスト効率
サーバーレスの本番展開
柔軟なインフラ
将来の成長を支える
Milvus scaled really well with batches ranging from 1,000 to millions of records. That really impressed me.
Todor Voynikov
トライアルハブについて
TrialHubは、臨床試験を最適化し、よりアクセスしやすく効率的にするためのデータインテリジェンスプラットフォームです。このプラットフォームは、治験依頼者と臨床研究機関に対し、過去の臨床試験、国別の医薬品償還状況、患者の治療経路に関する強力な洞察を提供し、PubMedを含む80,000以上の情報源からデータを収集する。IQは、RAG(Retrieval-Augmented Generation)ツールであり、治験や患者に関する自然言語での質問を可能にし、新たな試験デザインや運営戦略に役立てることができる。
課題:スケーラブルで信頼性の高いRAGシステムの構築
TrialHubのデータエンジニアであるTodor Voynikov氏がチームに加わったとき、彼はゼロから堅牢なRAGシステムを構築することを命じられました。RAGやベクターデータベースの経験がなかった彼は、すぐにアーキテクチャの研究に取り掛かりました。彼は、Pinecone、Qdrant、Milvusなど複数のベクトルデータベースを評価し、大規模な検索タスクを処理できることを確認しました。
その賭けは高かった:TrialHubは、膨大なデータセット(最大10億ベクトル)から、信頼性と関連性が厳しく要求される洞察を処理し、取得する必要があった。テキストは構造化、非構造化ソースから収集され、複雑なフォーマットで解析されたPDFも含まれていました。
Zilliz Cloudへの旅
Todor氏はまず、実際のデータを使って独自のベンチマークを実行し、パフォーマンス、スケーラビリティ、検索精度について複数のベクトルデータベースソリューションを評価しました。他のプラットフォームもある分野では同等であったが、Milvusはスケールでの検索性能で際立っていた。
「Milvusは、1,000件から数百万件に及ぶレコードのバッチで、実にうまくスケールしました。これには本当に感心しました。「パフォーマンスの差は、特に検索タスクにおいて顕著でした。
社内のテストで結果を確認し、TrialHubの他のチームと共有した後、Todor氏はMilvusのホスト版であるZilliz Cloudの導入を決定した。
トライアルハブがZilliz Cloudを選んだ理由
スケーラブルな検索パフォーマンス:** Zilliz Cloudは、ベクターボリュームが数億に拡大しても、一貫して高速な検索を実現しました。
カスタムベンチマーク検証:** Todorは、TrialHubの医療データを使用したカスタムベンチマークプロセスを開発し、ベクターDBのパフォーマンスを検証しました。
サーバーレス本番環境:**通常プロトタイピングに使用されるにもかかわらず、Zilliz Cloudのサーバーレス層はTrialHubの本番RAGシステムを最小限の問題で動かしています。
使いやすさと安定性:** PythonクライアントとAPIはTrialHubのLangChainベースのスタックとのスムーズな統合を可能にし、Zillizチームのサポートは安定性を確保しました。
TrialHubのZilliz Cloud利用方法
TrialHubのRAGシステムは、製薬会社がより成功する臨床試験をデザインするのをサポートします。LangChainとChatGPT APIとの統合により、ユーザーはPubMedのようなキュレーションされたソースをクエリすることができます。エンベッディングは、臨床データ用に最適化されたBERTから再トレーニングされたドメイン固有の医療モデルを使用して生成されます。これらのエンベッディングはZilliz Cloudに保存され、クエリされるため、高速で関連性の高い検索が可能になります。
現在、TrialHubのシステムは2億5000万以上のベクトルを管理しています。検索性能は成功に不可欠であり、Milvusが増大するデータセットに対して低レイテンシのレスポンスを維持できることが、チームがZilliz Cloudに依存し続ける大きな理由です。
今後の計画
チームが新しいデータソースを追加し、RAGシステムをさらにスケールアップするにつれて、TrialHubはベクターボリュームが大幅に増加すると予想している。チームはエンベッディングの重複排除を検討しており、このプロセスを簡素化する Milvus 2.6 の次期機能に期待している。さらに、エンジニアリングチームは、システム需要の増大に伴い、よりコントロールしやすい専用ティアへの移行を検討している。
結論
TrialHubの経験は、Zilliz Cloudのような専用に構築されたベクターデータベースが、規制産業におけるミッションクリティカルなAIアプリケーションをいかにサポートできるかを明確に示している。ベンチマーク主導の採用からサーバーレスの本番展開まで、Zilliz CloudはTrialHubが臨床試験の最適化のために、よりスマートで、より速く、よりスケーラブルなソリューションを提供するのに役立っています。