Milvus、LlamaIndex、GPTを使用したタックス・アピールRAGの構築
Zilliz、LlamaIndex、マイクロソフト、そしてシアトル地域の熱狂的なファンが、スタートアップの潜在的なアイデアを探求するために毎月ハッカソンを開催している。見ず知らずの4人が集まり、同じ日に生まれたアイデアの実用的なプロトタイプを作る可能性は、せいぜい低い。SaveHavenプロジェクトは、そんなストーリーを実証している。
LlamaIndex](https://zilliz.com/learn/getting-started-with-llamaindex)、Zilliz Cloud、またはRetrieval Augmented Generation (RAG)フレームワークを知らないプロダクトマネージャー、フルスタック開発者のカップル、そして熱狂的なAI開発者が初めて会ったと想像してください。RAGシステムの紹介を受け、3~4個のアイデアを出し合った後、残りの5時間で実行できそうなものに落ち着いた。これはそんなチームの物語である。
官僚制への挑戦
市、郡、州、連邦政府の官僚は、納税者が異議を申し立てることなく、8,500億ドル以上の税金、賦課金、罰金を徴収している。およそ5億件の不服申し立て、情報提供の要求、異議申し立て、追跡調査など、ほとんどの個人には対応能力がないため、ほとんどの人は公平な扱いを要求する代わりに問題を解決することになる。
私たちが開発したSaveHaven RAGアプリは、消費者が異議を申し立て、異議申し立てを処理し、自分自身の言い分を主張し、政府機関に「unclaimed money」としてタグ付けされた120億ドル以上の過剰徴収を節約するのを支援することによって、すべてを変えます。SaveHavenは、一般庶民の所得税や固定資産税の節税を支援することで、個人の権利を守る手助けをします。成功するかどうかは、最初の申し立てと、その後のフォローアップへの効果的な対応にかかっており、それには1年以上かけて4~5回の繰り返しが必要である。
解決策SaveHaven、より簡単な税金不服申し立てのためのRAGアプリ
私たちは、個人を代表する訴えを起こすための情報は、それぞれの機関が規定し公表している規制や要件に加え、郡、州、連邦の記録で入手可能であることを認識しました。的を絞った「情報公開法」の要求を提出することで、適切な機関に成功した通信、不服申し立て、異議申し立てへの対応、文書の例を収集することができる。RAGシステムを活用することで、成功した請願、上訴、抗議、異議処理を模倣することができ、訴訟に必要な文書を作成するためのわずかなコストで、前向きな結果を導くことができます。
ハッカソンでは、ウェブ・スクレーパーを使用して、キング郡の固定資産税不服申し立てに関する郡の記録、規則、ルールを取得しました。そして、提供されたクックブックを使って、このデータをベクター・データベースに入力した。そして、Reactjsを使用してウェブフロントエンドを作成し、LlamaIndexを使用してリクエストをオーケストレーションし、ベクトルデータベースから関連するエンベッディングをフェッチするAPIセットを構築した。ベクトルデータベースとしてMilvusを使用し、LLMとしてOpenAPIのGPTを使用した。
私たちのソリューションは単純で、入力として郡の区画番号または住所を求めるだけです。次に、比較可能な不動産の郡の記録を照会し、比較可能な不動産リストを使用して、土地と不動産の価値を最小化するための規制と規則に準拠したアピールを作成します。
デモの出力は、不服申し立てプロセスを開始するテキストを生成した。次の反復では、異議申し立てを取り入れ、1件につき19.99ドルの固定資産税の減額に成功した。固定資産税は毎年調整されるため、これは継続的な活動になると予想される。同様の問題は、州税や連邦所得税でも発生する。
ナレッジベース
我々は、オープンソースのスクラッパーを活用して、様々な政府のウェブサイトからデータを取得した。そして、データをチャンクし、ベクトル埋め込みに変換し、Milvusベクトルデータベースに格納した。私たちはこの1回限りの知識ベースを構築した。その上、プラットフォームが使用されているときにデータをどんどん追加していくので、どんどん改善されていく。
リクエスト・オーケストレーション
私たちはLlamaIndexを基本的なオーケストレーターとして使い、その上にいくつかのピースを構築した。LlamaIndexは、Milvusで関連するナレッジが見つからなかった場合、関連するデータをスクレイピングし、ナレッジベースを更新し、最終的なレスポンスを得るためにLLMと話をする。
API
私たちはAPIを公開するためにFastAPIフレームワークを使用し、シンプルかつ迅速に実現するためにPython3を使用してすべてのコンポーネントを構築しました。
要約
SaveHavenは、個人が固定資産税と所得税の査定に異議を申し立て、不服を申し立てるのを支援するRAGアプリです。このアプリは、税金の不服申し立てプロセスを合理化し、一般市民がよりアクセスしやすく、管理しやすくします。このシステムは、OpenAIのLlamaIndex、Milvus、GPTのような技術を採用し、公的記録からのデータの収集と分析を自動化することで、効果的な不服申し立ての準備を容易にします。
SaveHavenチームは、将来の起業家が我々の経験から学び、有意義なイノベーションを構築できるよう、このブログを手本とするつもりです。私たちは、GenAIが私たちの生活を一変させ、LlamaIndex、マイクロソフト、Zillizのテクノロジーによって、適切なチームがあれば1日以内にアイデアから実用的なソリューションまで実現できることを理解しています。
読み続けて

My Wife Wanted Dior. I Spent $600 on Claude Code to Vibe-Code a 2M-Line Database Instead.
Write tests, not code reviews. How a test-first workflow with 6 parallel Claude Code sessions turns a 2M-line C++ codebase into a daily shipping pipeline.

The Real Bottlenecks in Autonomous Driving — And How AI Infrastructure Can Solve Them
Autonomous driving faces a data bottleneck. Learn how AI-native vector databases like Zilliz solve scale, cost, and insight challenges across AV pipelines.

Zilliz Cloud Delivers Better Performance and Lower Costs with Arm Neoverse-based AWS Graviton
Zilliz Cloud adopts Arm-based AWS Graviton3 CPUs to cut costs, speed up AI vector search, and power billion-scale RAG and semantic search workloads.
