Zilliz Cloud、Arm NeoverseベースのAWS Gravitonでより優れたパフォーマンスと低コストを実現
AIの指数関数的な成長を支えるためにクラウドインフラが進化する中、Zilliz Cloud —Milvus 上に構築されたフルマネージドのベクトルデータベース —は、Arm NeoverseベースのCPUを活用し、エンタープライズ規模のAIワークロードに対して比類のないコスト効率とパフォーマンスを提供します。このブログでは、Zilliz Cloudが計算集約型ワークロード向けにx86からArm CPUへ移行し、運用コストを削減し、RAGやマルチモーダル検索などのミッションクリティカルなAIワークロード向けに10億規模のベクトル検索を可能にした方法を探ります。
Zilliz Cloud: 本番ワークロード向けフルマネージドベクトルデータベース
Zilliz Cloud は、本番環境のAIアプリケーション向けに設計されたフルマネージドのベクトルデータベースで、低コストで大規模なベクトル検索を提供します。オープンソースのMilvus上に構築され、非構造化データ(画像、テキスト、音声)全体で最大1,000億ベクトルをサポートし、20ms未満のレイテンシでベクトル類似検索を実現するため、RAG、AI Agents、ビジュアル検索、レコメンデーションシステム、異常検知などのアプリケーションに最適です。Zilliz Cloudの主な機能には、手動チューニングなしで高い検索精度を実現するために最適なインデックス戦略を動的に選択するAutoIndex、オープンソースのMilvusより10倍高速な検索を実現するCardinalインデックスエンジン、そしてより良い結果を得るために密ベクトル検索と全文検索を組み合わせるハイブリッド検索サポートが含まれます。
Zilliz Cloudの主なメリット
高性能: 数千QPSで10億規模のベクトルデータを提供可能。レイテンシ、精度、コストのバランスを実現する柔軟なクラスタタイプの選択
スケーラビリティ: 分散型クラウドネイティブアーキテクチャにより、最大1,000億ベクトルを処理できるよう水平スケール
コスト効率: RaBitQバイナリ量子化、ベクトルインデックス最適化、階層型ストレージによりインフラコストを70%削減
使いやすさ: AutoIndexとフルマネージドサービスにより、デプロイと運用を簡素化
ベクトルデータベースの理解
ベクトルデータベース は、埋め込みモデルによって生成される高次元ベクトルの保存に特化しています。これらのベクトルはApproximate Nearest Neighbour検索によるセマンティック検索を可能にし、自然言語処理、コンピュータビジョン、レコメンダーシステムにおけるAIワークフローに不可欠です。リアルタイムインデックス作成とマルチモーダルクエリを処理することで、ベクトルデータベースは非構造化データを効率的に管理する課題に対応します。Zilliz Cloudはこれらの機能を活用して、20ms未満のレイテンシでAIアプリケーションを支え、本番ワークロードに高いパフォーマンスを保証します。
Milvusの役割
Milvus は、GitHubで36K以上のスターを持つ最も人気のあるオープンソースベクトルデータベースであり、そのスケーラブルなクラウドネイティブアーキテクチャによってZilliz Cloudの基盤となっています。その分散設計により、Zilliz Cloudは低レイテンシを維持しながら数十億ベクトルにわたって水平スケールでき、大規模データセットを効率的に処理できます。
Milvus 2.3以降、Arm CPUサポートがArm64向け公式Dockerイメージとともに追加され、コスト効率とエネルギー効率に優れたプラットフォームでのインストールとデプロイが簡素化されました。Arm CPU上でMilvusを実行すると、従来のx86と比較して20%のパフォーマンス向上が得られ、迅速なベクトル検索と取得に依存するアプリケーションでより高速なクエリが実現します。
ArmベースCPUへの道のり
Zilliz CloudによるArmベースのAWS Graviton3プロセッサの採用は、AIワークロードの性能とコスト効率における戦略的な飛躍を示しています。Arm Neoverseアーキテクチャを基盤とするAWS Graviton3プロセッサは、SVEおよびBFloat16命令のサポートを活用し、優れた性能と効率を実現します。これらのアーキテクチャ上の強化には、より広いベクトルユニットと改善されたソフトウェアスタックも含まれており、Graviton3は、高スループットのベクトル演算とリアルタイム処理を必要とするセマンティック検索やRAGパイプラインのようなGenAIタスクに理想的な選択肢となっています。
コストは、企業における大規模AI検索の導入に対する大きな障壁です。これに対処するため、Zilliz Cloudはコストを大幅に削減し効率を向上させる数多くのエンジニアリング最適化を実施しており、10億規模であっても、顧客がベクトル検索をより利用しやすくしています。
ベクトル演算向けの高度な計算能力と最適化された命令設計を理解して以来、Zilliz CloudチームはArmおよびAWSチームと緊密に連携し、計算負荷の高いインデックス作成ワークロードをAWS Graviton3へ移行してきました。
AWS Graviton3プロセッサを採用する最も注目すべき利点の1つは、性能とコスト効率の大幅な向上です。具体的には、Zilliz Cloudでは以下が確認されています。
インデックス構築性能: インデックス構築性能はx86実装と比較して50%向上し、データ取り込み時の重要な処理であるベクトルインデックス作成を大幅に高速化し、検索時のクエリを高速化しています。この強化により、より高速なデータ処理と、10億規模のベクトルデータセットのより効率的な取り扱いが可能になります。
検索処理: 検索処理では、x86とのベンチマーク比較で10%の効率向上が見られ、クエリ実行結果の高速化と、より応答性の高いデータ取得につながっています。この改善により、大規模データセット内をよりスムーズにナビゲートでき、ユーザーは特定のレコードを素早く見つけたり、膨大な情報を探索したりできます。
性能向上に加えて、AWS Graviton3ベースのクラウドインスタンスの採用により、Zilliz Cloudの運用コストは10%削減されました。これは、x86インスタンスと比較したプロセッサのエネルギー効率と価格性能比の優位性によるものです。このアップグレードは、AIアプリケーション向けに高性能でコスト効率の高いソリューションを提供するというZilliz Cloudのミッションに合致しています。AWS Graviton3プロセッサを活用することで、Zilliz Cloudは要求の厳しいGenAIワークロードへの対応能力を高めると同時に、総所有コストを削減します。
「AWS GravitonのArm Neoverseベースのアーキテクチャは、本番環境における大規模ベクトル検索に対して、コスト効率とエネルギー効率に優れたソリューションを提供し、企業が性能を損なうことなくAI検索の導入を拡大できるようにします」と、Zillizのエンジニアリング担当VPである James Luan は述べています。「Armの革新的な設計を統合することで、Zilliz Cloudは、競争力を維持するために必要な高性能を保ちながら、組織がAIアプリケーションをより高い効率で拡張できるよう支援します。」
結論
Zilliz CloudによるArmベースのAWS Graviton3プロセッサの統合は、重要なワークロード向けにスケーラビリティとコスト最適化された性能を組み合わせ、AIインフラストラクチャにおける競争優位性をもたらします。強化された計算能力とエネルギー効率に優れたアーキテクチャを活用することで、このプラットフォームは、より高速なインデックス構築、加速された検索機能、インフラコストの削減を通じて、AI/MLデプロイメントを加速します。組織がAI駆動型ワークロード向けにスケーラブルでコスト効率の高いソリューションをますます重視する中、Zilliz Cloudによる高性能かつコスト効率の高いコンピューティング技術の採用は、革新的で効率的なクラウドサービスを提供するリーダーであり続けることを保証します。この先見的なアプローチにより、顧客は、ますます複雑化し進化する技術環境の中で俊敏性を維持しながら、複雑なデータ課題に取り組むことができます。
Arm アーキテクチャ上で AI アプリケーションを強化するための、実戦で鍛えられたツール、デモ、ステップバイステップガイドについては、Arm Developer Hubをご覧ください。
セマンティック検索に革新を起こす準備はできていますか?Arm ベースのサーバーで Zilliz Cloud を使用して RAG 搭載アプリケーションを構築するチュートリアルをご覧ください。
Arm Cloud Migrationでシームレスに移行しましょう。Arm 上で効率を高め、パフォーマンスを最適化するための近道です。
読み続けて

Zilliz Cloud Update: Tiered Storage, Business Critical Plan, Cross-Region Backup, and Pricing Changes
This release offers a rebuilt tiered storage with lower costs, a new Business Critical plan for enhanced security, and pricing updates, among other features.
Milvus/Zilliz + Surveillance: How Vector Databases Transform Multi-Camera Tracking
See how Milvus vector database enhances multi-camera tracking with similarity-based matching for better surveillance in retail, warehouses and transport hubs.

Bringing AI to Legal Tech: The Role of Vector Databases in Enhancing LLM Guardrails
Discover how vector databases enhance AI reliability in legal tech, ensuring accurate, compliant, and trustworthy AI-powered legal solutions.



