Fireworks AI
Build AI applications by combining Fireworks AI's LLM models with Zilliz Cloud's vector database capabilities
この統合を無料で利用する花火について
AI Fireworks AIは、高いパフォーマンスと信頼性でAIモデルの実行とカスタマイズを可能にするジェネレーティブAIプラットフォームです。このプラットフォームは、サーバーレスモデル、オンデマンドデプロイメント、テキスト、オーディオ、イメージ、エンベッディングモデルの微調整オプションを提供します。
同プラットフォームは従量課金モデルを採用しており、Fluminaフレームワークを通じてJSONモード、文法モード、関数呼び出しなどの機能を備えている。
なぜZilliz Cloudと花火なのか
AI Zilliz CloudとFireworks AIを組み合わせることで、AIアプリケーションを構築するための強固な基盤を構築します。Zilliz Cloudはベクトルストレージと類似検索を処理し、Fireworks AIは最適化された言語と埋め込みモデルへのアクセスを提供します。
この統合により、開発者は複雑なインフラストラクチャを管理することなく、生産可能なAIアプリケーションを構築することができます。この組み合わせは、信頼性の高いベクトル検索と高性能なLLM機能を必要とするアプリケーションに特に有効です。
ZillizクラウドとFireworks AIの仕組み
この統合は、Fireworks AIのモデルを使ってデータから埋め込みデータを生成し、それをZilliz Cloudに保存して検索することで機能する。関連情報を検索する必要がある場合、Zilliz Cloudはこれらの埋め込みデータに対して類似検索を実行します。 RAGアプリケーションの場合、Zilliz Cloudはベクトルの類似性に基づいて最も関連性の高いドキュメントを検索し、それをFireworks AIのLLMが使用して正確で文脈に沿った応答を生成します。
技術的実装
認証セットアップ:
- FireworksのAPIキーを環境変数として設定する
- URIとAPIキーを使用したZilliz Cloud接続の設定
- データ処理の流れ
- Fireworks AIの埋め込みモデル(例:nomic-ai/nomic-embed-text-v1.5)を使って埋め込みデータを生成する。
- 指定した次元のZilliz Cloudコレクションにベクトルを格納
- ベクトル検索に内積(IP)またはコサイン類似度を使用
- コレクション管理:
- 特定のパラメータでコレクションを作成
- 埋め込みモデルの出力に基づいて次元サイズを設定
- データの信頼性のための一貫性レベルの設定
- 検索と取得:
- カスタマイズ可能な制限によるセマンティック検索の実行
- 類似度スコアによる関連文書の検索
- Fireworks AI の LLM を通して結果を処理し、最終的な回答を得る
- FireworksのAPIキーを環境変数として設定する
学ぶ
チュートリアルこのチュートリアルでは、Fireworks AI & Zilliz Cloudを使ったRAG(Retrieval-Augmented Generation)システムの構築方法を説明します。
さらにいくつかのリソースがあります:
- Fireworks AI ドキュメント](https://docs.fireworks.ai/getting-started/introduction)
- MilvusとFireworks AIによるRAG構築](https://milvus.io/docs/build_RAG_with_milvus_and_fireworks.md)
- APIリファレンスドキュメント](https://docs.fireworks.ai/api-reference/introduction)


