ブログ
Milvus 2.3 Betaの新機能 - GPUで10倍高速化

Milvus 2.3 Betaの新機能 - GPUで10倍高速化

Mar 21, 20230 min read

Milvusコミュニティを代表してMilvus 2.3のベータリリースを発表できることを誇りに思います。このベータリリースには新機能と改善が含まれており、お客様のAIを活用したアプリケーションのパフォーマンスを向上させるものと確信しております。一般リリースへの迅速な移行のため、これらの機能のテストにご協力いただければ幸いです！このブログ記事では、より顕著な機能のいくつかを紹介します。変更点の完全なリストについては、リリースノートをご覧ください。

📦 PyPI: https://pypi.org/project/milvus/
ドキュメント: https://milvus.io/docs
🛠️ リリースノート：https://github.com/milvus-io/milvus/releases
Docker Image: docker pull milvusdb/milvus
🚀 リリース：https://github.com/milvus-io/milvus/releases/tag/v2.3.0-beta

Milvus2.3ベータ版の特徴の一つは、GPUアクセラレーションとRAFTベースの統合のサポートであり、これによりMilvusは最新のグラフィック処理ユニットのパワーを最大限に活用することができます。GPUアクセラレーションに対応したMilvusは、CPUのみのバージョンよりも10倍速いパフォーマンスを実現します。これにより、AIや機械学習を活用したアプリケーションの速度と応答性が大幅に向上し、より高速で正確なデータ処理が可能になります。

Milvus 2.3 Betaのもう一つの重要な特徴は、範囲検索のサポートで、指定した範囲内のデータを検索することができます。これは、より正確で精度の高い検索を可能にするため、複雑なデータクエリを必要とするアプリケーションに特に役立ちます。さらに、Milvus 2.3 Betaは、mmapと増分バックアップもサポートしており、これらはすべて、AIアプリケーションのパフォーマンスと効率をさらに高めるのに役立ちます。より効率的なデータの管理と保存を可能にすることで、これらの機能は、お客様のAIシステムが継続的にピークレベルで動作することを保証します。

全体として、このリリースの改善は、類似検索機能を持つアプリケーションを構築する開発者にとって不可欠なものです。

Nvidia GPU サポート。この新機能は、ヘテロジニアス・コンピューティングをサポートする能力をもたらし、特殊なワークロードを大幅に加速することができます。この新しい追加機能により、ユーザーはより高速で効率的なベクトルデータ検索を期待できるようになり、最終的に生産性とパフォーマンスが向上します。 RAFT-IVF-Flat（GPU）とIVF-Flat（CPU）およびHNSW（CPU）を、再現率95%の4つのデータセットで比較しました。GPUインデックスは、IVF-FlatおよびHNSWと比較して、平均32倍および8倍の高いスループットを達成した。評価結果を表1に示す。(これらのベンチマークは、8コアCPU、32GBのRAM、Nvidia A100 GPUを搭載したホスト上で、Knowhereに対して実行されました。）

表 1.4つのデータセットにおけるIVF-Flat、HNSW、RAFT-IVF-FlatのQPS（再現率95%）。

	シフト	ギスト	グローブ	ディープ
IVF-Flat（CPU）｜3097｜142｜791｜723｜｜を実行した。

| RAFT-IVF-Flat（GPU）｜121,568｜5,737｜20,163｜16,557｜｜です。

RAFTコードに貴重な貢献をしてくれたNvidiaの@wphicksと@cjnoletに感謝する。

**範囲検索範囲検索はk-NNクエリとは異なる検索方法である。k-NNクエリは固定数の最近傍を返す。範囲検索では、クエリqと距離閾値Rが与えられると、qから距離R以内のすべてのエンティティを返す。範囲検索は一般的に、指定された範囲内のすべての関連する結果を見つけるために使用される。例えば、データの重複排除や著作権侵害の検出において、類似の候補を見逃すことなく検索することができる（ただし、これに限定されない）。

**アップサート Upsertは、エンティティの値がコレクションに既に存在する場合は更新し、存在しない場合は新規に挿入する操作です。Milvusはコレクションにデータを追加する高い柔軟性を提供します。今のところ、全部で3つのオプションがあります：

オフラインの場合、高スループットの一括挿入。
オンラインストリーミングの場合、低遅延のための挿入。
新しいエンティティを更新するか挿入するか迷っている場合のUpsert。

変更データキャプチャ（CDC）。チェンジデータキャプチャ(CDC)とは、ベクターデータベース内のデータに対する変更をリアルタイムで特定・キャプチャし、その変更を下流システムに配信するプロセスです。Milvusは現在、このメカニズムに基づくゼロダウンタイムのバックアップと同期を提供しています。開発者はCDCを使用して、データ分析やカスタマイズされた監査など、ダウンストリームのワークロードに継続的な変更をキャプチャして提供することもできます。

メモリマップド（mmap）ファイルI/O。 Milvus](https://zilliz.com/what-is-milvus)は、大規模なデータセットでメモリが不足し、クエリのパフォーマンスが重要でない場合、mmapを使用して、システムがファイルの一部をメモリにあるかのように扱うことを可能にし、メモリ使用量を削減し、すべてのデータがシステムのページキャッシュにある場合のパフォーマンスを向上させる。

まとめ

上記の機能に加えて、Milvus 2.3 Beta ではいくつかのバグフィックスと改善が行なわれています。詳しくは

変更点の完全なリストは、バージョン2.3 Betaのリリースノートを参照してください。
Milvus](https://hub.docker.com/r/milvusdb/milvus)およびget startedをダウンロードしてください。
この論文でMilvusベンチマークをチェックしてください。

article.updateAt

Chris Churilo
Chris Churilo is the VP of Marketing & Community at Zilliz where she leads all community, developer relations, and marketing efforts. Prior to Zilliz, Chris was a founding member of the InfluxData’s go to market efforts and helped propel the time series database platform to dominance in the market. In earlier roles she defined and designed a SaaS monitoring solution at Centroid, and prior to that she was the VP of product management at iPass and was the LOB for several cloud services that required her to track the business and operational metrics and analytics to help identify and resolve issues.

コンテンツ

まとめ

無料で始めて、簡単にスケール

あなたのGenAIアプリケーションのために構築されたフルマネージドのベクトルデータベースを試してみてください。

Zilliz Cloudを無料で試す

この記事を共有

読み続けて

What is the K-Nearest Neighbors (KNN) Algorithm in Machine Learning?

KNN is a supervised machine learning technique and algorithm for classification and regression. This post is the ultimate guide to KNN.

Top 10 AI Agents to Watch in 2025 🚀

AI agents are like having a supercharged assistant by your side—analyzing data, making decisions, and seamlessly integrating with tools and environments.

Mixture-of-Agents (MoA): How Collective Intelligence Elevates LLM Performance

Mixture-of-Agents (MoA) is a framework where multiple specialized LLMs, or "agents," collaborate to solve tasks by leveraging their unique strengths.