C12.ai, Milvus 벡터 데이터베이스로 신약 개발 가속화

10× 더 빠른 검색
즉각적인 반응 검색으로 쿼리 시간을 몇 분에서 몇 초로 단축합니다.
원활한 확장성
수백만 건의 반응과 증가하는 워크로드를 손쉽게 처리합니다.
탁월한 관련성
고품질의 화학적으로 실용적인 반응 제안을 제공합니다.
향상된 사용자 경험
더 빠르고 스마트한 역합성으로 플랫폼 도입을 촉진했습니다.
C12.ai 소개
2022년에 설립된 C12.ai는 최첨단 AI와 체화 지능 기술을 결합하여 제약 연구개발 실험실을 혁신하고 있습니다. 이 회사의 사명은 실험실이 기존 자동화를 넘어, 지능적인 의사결정을 실험실 워크플로에 내재화함으로써 수작업 병목을 줄이고, 효율성을 높이며, 운영 비용을 낮추도록 돕는 것입니다. 실시간 인사이트와 더 지능적인 자동화와 같은 혁신을 통해 C12.ai는 지능형 제약 R&D의 새로운 시대를 이끌고 있습니다.
C12.ai의 핵심 초점은 역합성 분석—신약 개발 및 유기 합성 화학에서 중요한 기법—입니다. 복잡한 분자를 더 단순한 전구체로 분해하고 합성 경로를 설계함으로써, 화학자들은 신약 발견을 가속화할 수 있습니다. C12.ai는 과거 화학 반응 데이터와 지능형 검색 시스템을 활용하여 더 빠르고 효과적인 합성 계획을 촉진함으로써 이 과정을 향상시킵니다.
과제: 복잡한 역합성 경로 설계
역합성 경로 설계에서 C12.ai는 몇 가지 주요 과제에 직면했습니다:
1. 대규모 반응 데이터베이스 관리
화학 데이터베이스에는 수천만 또는 수억 건의 반응 기록이 포함되어 있습니다. 특정 변환과 가장 관련성이 높은 소수의 선례를 찾으려면 기존 데이터베이스로는 도저히 제공할 수 없는 정교한 검색 기능이 필요합니다.
2. 고차원 유사도 검색의 효율적 계산
Extended Connectivity Fingerprints (ECFP)와 같은 최신 화학 핑거프린팅 기법은 분자 구조를 수백 또는 수천 차원의 고차원 벡터로 변환합니다. 기존 데이터베이스 시스템에는 이러한 복잡한 벡터 전반의 유사도를 대규모로 계산하는 데 필요한 전문 인덱싱이 부족합니다.
3. 실시간 인터랙티브 설계 구현
효과적인 역합성 설계는 반복적이고 인터랙티브한 프로세스입니다. 화학자들은 여러 경로를 빠르게 탐색하고, 대안을 평가하며, 제안된 각 경로에 대한 즉각적인 피드백을 받아야 합니다. 이를 위해서는 지속적으로 1초 미만의 응답 시간을 제공할 수 있는 시스템이 필요합니다.
4. 화학적 관련성과 실용성 보장
순수한 수학적 유사도만으로는 충분하지 않습니다—검색된 반응은 진정으로 유용하려면 특정 화학적 특성과 반응 조건에 부합해야 합니다. 시스템은 원시 유사도 검색과 메커니즘, 수율, 실제 적용 가능성에 관한 전문가 규칙을 결합해야 합니다.
실시간으로 확장 가능하고 매우 정확한 역합성 설계를 지원할 수 있는 플랫폼을 제공하기 위해 C12.ai에는 새로운 유형의 솔루션이 필요했습니다.
솔루션: Milvus를 활용한 벡터 검색
여러 옵션을 평가한 후, C12.ai는 유사 반응 검색 엔진의 기반으로 Milvus를 선택했습니다. 이 선택은 Milvus가 화학적 유사도 검색에 특히 적합하도록 만드는 몇 가지 핵심 장점에 의해 결정되었습니다:
C12.ai가 Milvus를 선택한 이유
초고속, 정확한 벡터 검색: Milvus는 IVF 및 HNSW를 포함한 최첨단 인덱싱 기법을 활용하며, 이는 벡터 공간을 분할하고 양자화를 적용하여 검색 지연 시간을 크게 줄입니다. 이 아키텍처는 수억 개의 벡터를 포함하는 컬렉션 전반에서 밀리초 수준의 응답 시간을 가능하게 하며, 이는 인터랙티브 역합성 설계에 정확히 필요한 것입니다.
탄력적 분산 아키텍처: Kubernetes의 컨테이너에 배포된 Milvus는 손쉽게 수평 확장됩니다. 데이터는 노드 전반에 자동으로 샤딩되고 복제되어 성능 확장성과 고가용성을 모두 제공합니다. 이 인프라는 변화하는 워크로드와 증가하는 데이터셋에 동적으로 적응합니다.
기존 시스템과의 원활한 통합: Python, Java 및 기타 언어용 포괄적인 SDK를 통해 Milvus는 C12.ai의 기존 화학정보학 워크플로에 원활하게 통합됩니다. 이를 통해 팀은 전체 기술 스택을 재구축하지 않고도 고급 벡터 검색을 구현할 수 있었습니다.
비용 효율적인 확장: 리소스 활용을 최적화하고 동적 확장을 지원함으로써, Milvus는 모놀리식 또는 기존 데이터베이스 솔루션에 비해 인프라 비용을 크게 절감합니다. 이는 계속 증가하는 화학 반응 데이터의 양을 처리하는 데 중요한 고려 사항입니다.
Milvus가 C12.ai의 플랫폼을 구동하는 방식
C12.ai는 유사 반응 검색의 모든 단계에서 Milvus를 활용하는 포괄적인 워크플로를 구현했습니다.
1. 화학 반응 데이터 벡터화
C12.ai의 데이터베이스에 있는 각 반응은 특화된 화학 지문 알고리즘을 사용해 고차원 벡터 임베딩으로 인코딩됩니다. 이러한 임베딩은 반응물, 생성물, 촉매, 용매 및 반응 조건의 핵심 특성을 포착하여 Milvus에서 효율적으로 처리할 수 있는 수학적 표현을 만듭니다.
2. 최적화된 검색 인덱스 구축
이 구현은 Milvus의 IVF (Inverted File Index) 구조를 활용하며, 이는 벡터 공간을 클러스터로 분할하고 양자화된 중심점을 사용해 데이터 포인트를 근사합니다. 이 접근 방식은 정확한 비교의 범위를 가장 유망한 클러스터로 제한함으로써 검색 성능을 크게 가속화합니다.
3. 확장성과 복원력을 위한 워크로드 분산
C12.ai의 Milvus 배포는 Kubernetes 기반 클러스터에서 실행되어 여러 컴퓨팅 노드 전반에서 병렬 처리를 가능하게 합니다. 이 컨테이너화된 아키텍처는 높은 부하에서도 원활하게 확장되며 자동 복제와 장애 조치를 통해 강력한 내결함성을 제공합니다.
4. 도메인별 필터로 결과 향상
원시 벡터 유사도 결과는 C12.ai의 독자적인 화학 지식 규칙을 통해 추가로 정제됩니다. 검색된 반응은 조건 호환성, 보고된 수율 및 합성 맥락에서의 실제 적용 가능성을 기준으로 점수가 매겨집니다. 이 하이브리드 접근 방식은 화학자들이 단순히 구조적으로 유사한 반응이 아니라, 특정 합성 과제에 진정으로 유용한 반응을 받을 수 있도록 보장합니다.
워크플로 개요
아래 다이어그램에 표시된 것처럼, 시스템에는 두 가지 병렬 워크플로가 있습니다. 하나는 반응 라이브러리를 준비하기 위한 것이고, 다른 하나는 실시간 쿼리 처리를 위한 것입니다.
Milvus가 C12.ai의 플랫폼을 구동하는 방식
워크플로 1: 반응 라이브러리 준비 및 벡터화: C12.ai는 먼저 전체 화학 반응 데이터베이스를 처리하여 각 반응식을 벡터화하고, 반응물, 촉매, 용매 및 조건과 같은 핵심 분자 특징을 포착합니다. 그런 다음 이러한 벡터는 Milvus로 가져와지며, 여기서 IVF와 같은 효율적인 인덱스가 구축됩니다. 이 준비 단계는 필요할 때 수백만 개의 반응을 빠르고 정확하게 검색할 수 있도록 보장합니다.
워크플로 2: 실시간 쿼리 처리: 대상 반응이 입력되면, 시스템은 동일한 형식으로 입력을 벡터화하고 Milvus에서 유사도 검색을 수행하여 상위 K개의 가장 가까운 반응을 검색합니다. 그런 다음 초기 결과는 반응 조건, 수율 및 실제 적용 가능성을 고려하는 도메인별 규칙을 통해 재순위화됩니다. 재순위화 후, 시스템은 상세 정보를 가져와 화학자들에게 고품질의 실행 가능한 합성 옵션을 실시간으로 제공합니다.
구현 결과 및 이점
Milvus를 역합성 설계 플랫폼에 통합한 이후, C12.ai는 여러 측면에서 놀라운 개선을 달성했습니다:
10배 빠른 검색
수백만 개의 반응 항목을 포함한 데이터베이스를 쿼리할 때도 검색 시간이 몇 분에서 몇 초로 단축되었습니다. 이러한 극적인 속도 향상은 화학자들이 합성 경로를 빠르게 반복 개선할 수 있는 진정한 인터랙티브 설계 워크플로를 가능하게 합니다.
원활한 확장성
분산형 Milvus 배포는 증가하는 데이터 규모와 피크 쿼리 부하를 손쉽게 수용합니다. C12.ai가 새로운 문헌 및 실험 데이터로 반응 데이터베이스를 지속적으로 확장함에 따라, 시스템은 주요 아키텍처 변경 없이도 일관된 성능을 유지합니다.
뛰어난 결과 관련성
벡터 검색과 화학 도메인 필터링을 결합함으로써, 이 플랫폼은 목표 변환과 구조적·맥락적으로 모두 부합하는 제안을 제공합니다. 이러한 높은 관련성은 실험실에서 더 성공적인 합성과 더 적은 실패 실험으로 직접 이어집니다.
향상된 사용자 경험
빠른 응답 시간과 고품질 매칭의 결합은 사용자 만족도를 크게 향상시켰습니다. 이제 화학자들은 합성 옵션을 더 면밀히 탐색하고 더 확신 있게 의사결정을 내릴 수 있어, 전체 신약 개발 프로세스를 간소화할 수 있습니다.
결론
C12.ai와 Milvus의 파트너십은 전문화된 벡터 데이터베이스 기술이 복잡한 과학 워크플로를 어떻게 혁신할 수 있는지를 보여줍니다. Milvus는 방대한 데이터 규모와 고차원 연산이라는 두 가지 과제를 해결함으로써, C12.ai가 전례 없는 속도, 정확도, 사용성을 제공하는 역합성 설계 플랫폼을 구축할 수 있도록 지원했습니다.
개발 기간과 비용을 줄여야 한다는 강한 압박에 직면한 제약 회사들에게, 이 기술은 강력한 경쟁 우위를 제공합니다—보다 효율적인 합성을 설계하고, 더 넓은 화학 공간을 탐색하며, 궁극적으로 생명을 구하는 의약품을 더 빠르게 시장에 출시할 수 있게 해줍니다.


