AI幻覚

AI幻覚
♪AIの幻覚とは?
AI幻覚とは、(ChatGPTのような)言語モデルによって提供された答えが、一見合理的に見えるが、全くの誤りである場合に起こります。このような不正確な回答は、言語モデルが意図的に嘘をついているのではなく、モデルに使用されている学習データが、正しく回答するために必要な情報を含んでいないために起こります。例えば、2021年9月以降に生成されたデータはChatGPTのトレーニングに含まれていないため、そのようなデータについて問い合わせてもChatGPTは正確に回答することができません。
ChatGPTは回答がないことを示す場合もありますが、全くの捏造回答を生成する場合もあります。
AI幻覚問題の説明AIの幻覚は、AIモデルが正しくない情報を生成し、それをあたかも事実であるかのように提示するときに起こります。このような幻覚は、多くの場合、学習データとアルゴリズムにおける限界や偏りの結果であり、不正確で潜在的に有害なコンテンツの生成につながります。
AIはなぜ幻覚を見るのか
AIの幻覚には、以下のような理由がある:
- 不十分、古い、または低品質のトレーニングデータ:AIモデルは、それが訓練されたデータと同じくらい良いものでしかない。AIツールがあなたのプロンプトを理解していなかったり、十分な情報が不足していたりすると、たとえそれが不正確であっても、応答を生成するためにトレーニングされた限られたデータセットに頼る可能性があります。
- オーバーフィット:限られたデータセットで訓練されたAIモデルは、入力と対応する出力を記憶してしまう可能性がある。その結果、新しいデータへの汎化に苦戦し、AIの幻覚を効果的に引き起こす可能性がある。
さらに、AIモデルが訓練を受けていない慣用句や俗語の使用、AIを混乱させるよう意図的にプロンプトを作成する敵対的攻撃など、他の要因もAIの幻覚につながる可能性がある。
AIの幻覚の例
AIの幻覚の例として、ChatGPTと作業したときの例があります。私たちがChatGPTに "Hugging FaceはOpenAI Whisperをサポートしていますか?"と質問したとき、ChatGPTはその限界を認め、データがないという正確な答えをくれましたが、その答えは本当に役に立ちませんでした。
*2021年9月現在、Hugging FaceはOpenAI Whisperのサポートを発表していません。しかし、将来的にサポートを追加する可能性は常にある。OpenAI WhisperはOpenAIの新しい言語モデルであり、他の企業や開発者が自社のプラットフォームや製品に統合するには時間がかかるかもしれません。
最新のコンテンツ(Githubリポジトリ、ドキュメント、readmeなど)をベクトルデータベースに保存しているチャットボット経由で同じ質問をすると、全く異なる、正確な結果が得られる;
*ハギング・フェイスはOpenAI Whisperをサポートしています。FlaxWhisperModelクラスはtransformersライブラリにあり、OpenAI Whisperモデルのラッパーです。このクラスを使って、事前にトレーニングされたOpenAI Whisperモデルをロードし、テキスト分類、質問応答、テキスト生成などの様々な自然言語処理タスクに使用することができます。
AI の幻覚を減らすには?
AIの幻覚を減らしたり取り除いたりするために、いくつかのことができる。1つ目は、答えを探すときにLLMに具体的な指示を与えることです。例えば、「はい」か「いいえ」のどちらかのみで回答するように求めたり、正確さを保証するために参考文献を提供するように求めたり、温度設定を弄ったりすることもできます。
さらに、実際のデータを提供して答えを出すこともできる。これは、あなたのデータをvector embeddings に変換し、ベクトルデータベースに保存することで行われます。ほとんどの場合、ユーザーが対話するチャットボットのフロントエンドがあります。ユーザーは質問をします。質問はベクトル埋め込みに変換されます。そして、近似最近傍検索を行い、意味的に類似した項目を見つけ、このデータをLLMに提示して正確な応答を生成する。
ZillizはAIの幻覚に役立つか?
Zilliz Cloud (そしてMilvus)は、ベクトル埋め込みに変換された知識ベースを保存しクエリすることで、AIの幻覚を助ける。OSSChatは、ベクトル・データベースがどのように幻覚を減らすために使われるかを示すサンプル・アプリケーションです。幻覚を減らすためにZillizをどのように使うことができるかについて、さらにいくつかのリソースを紹介します:
- ChatGPT+ Vector database + prompt-as-code - The CVP Stack](https://zilliz.com/blog/ChatGPT-VectorDB-Prompt-as-code)
- OpenAIのChatGPTについて](https://zilliz.com/learn/ChatGPT-Vector-Database-Prompt-as-code)
- ChatGPTのキャッシュ](https://zilliz.com/blog/Yet-another-cache-but-for-ChatGPT)