Hallucination de l'IA

Que sont les hallucinations de l'IA ?

Les hallucinations de l'IA se produisent lorsque la réponse fournie par le modèle de langage (comme ChatGPT) semble raisonnable mais est entièrement fausse. Ces réponses inexactes ne sont pas le résultat d'un mensonge intentionnel du modèle linguistique, mais plutôt du fait que les données d'entraînement utilisées pour le modèle ne contiennent pas les informations nécessaires pour répondre correctement. Par exemple, les données générées après septembre 2021 n'ont pas été incluses dans la formation de ChatGPT, qui ne peut donc pas répondre correctement si vous demandez des informations sur ces données.

Dans certains cas, ChatGPT indiquera qu'il n'a pas la réponse, mais dans d'autres cas, il pourra générer une réponse entièrement fabriquée.

Le problème des hallucinations de l'IA expliqué

Une hallucination de l'IA se produit lorsqu'un modèle d'IA génère des informations incorrectes mais les présente comme s'il s'agissait d'un fait. Ces hallucinations sont souvent le résultat de limitations ou de biais dans les données d'apprentissage et les algorithmes, ce qui conduit à la production d'un contenu inexact et potentiellement dangereux.

Pourquoi l'IA hallucine

Les hallucinations de l'IA peuvent se produire pour plusieurs raisons, notamment

Des données d'entraînement insuffisantes, obsolètes ou de mauvaise qualité : La qualité d'un modèle d'IA dépend des données sur lesquelles il a été entraîné. Si l'outil d'IA ne comprend pas votre message ou ne dispose pas d'informations suffisantes, il peut s'appuyer sur l'ensemble limité de données sur lequel il a été formé pour générer une réponse, même si celle-ci est inexacte.
Ajustement excessif : Un modèle d'IA formé sur un ensemble de données limité peut mémoriser les entrées et les sorties correspondantes. Par conséquent, il peut avoir du mal à s'adapter à de nouvelles données, ce qui conduit à des hallucinations de l'IA.

En outre, d'autres facteurs peuvent contribuer aux hallucinations de l'IA, comme l'utilisation d'expressions idiomatiques ou argotiques auxquelles le modèle d'IA n'a pas été formé et les attaques adverses où les invites sont intentionnellement conçues pour embrouiller l'IA.

Exemples d'hallucinations de l'IA

Parmi les exemples d'hallucinations de l'IA, citons cet exemple de travail avec ChatGPT. Lorsque nous avons posé à ChatGPT la question "Does Hugging Face support OpenAI Whisper ?", il a admis ses limites et nous a donné une réponse exacte, à savoir qu'il ne disposait pas des données, mais la réponse n'était vraiment pas utile.

*En date de septembre 2021, Hugging Face n'a pas annoncé de support pour OpenAI Whisper. Cependant, il est toujours possible qu'ils ajoutent un support dans le futur. OpenAI Whisper est un nouveau modèle de langage d'OpenAI, et cela peut prendre un certain temps pour que d'autres entreprises et développeurs l'intègrent dans leurs plates-formes et leurs produits.

Lorsque nous posons la même question à un chatbot qui stocke le contenu le plus récent (repo Github, docs, readmes, etc.) dans une [base de données vectorielle] (https://zilliz.com/learn/what-is-vector-database), nous obtenons un résultat totalement différent et précis ;

*Oui, Hugging Face supporte OpenAI Whisper. La classe FlaxWhisperModel est disponible dans la bibliothèque des transformateurs, qui est une enveloppe autour du modèle OpenAI Whisper. Vous pouvez utiliser cette classe pour charger le modèle OpenAI Whisper pré-entraîné et l'utiliser pour diverses tâches de traitement du langage naturel telles que la classification de textes, la réponse à des questions et la génération de textes.

Comment réduire les hallucinations de l'IA

Vous pouvez faire plusieurs choses pour réduire ou éliminer les hallucinations de l'IA. La première consiste à donner au LLM des instructions spécifiques lorsqu'il cherche votre réponse. Par exemple, vous pouvez lui demander de ne répondre que par "oui" ou "non", ou vous pouvez lui demander de fournir des références pour vous aider à garantir la précision, ou vous pouvez également jouer avec les paramètres de température.

En outre, vous pouvez lui fournir les données réelles pour formuler la réponse. Pour ce faire, vos données sont converties en [vector embeddings ] (https://zilliz.com/glossary/vector-embeddings) et stockées dans une base de données vectorielle. Dans la plupart des cas, il existe un chatbot frontal avec lequel l'utilisateur interagit. Les utilisateurs posent leurs questions ; la question est alors convertie en une intégration vectorielle. Vous effectuez ensuite une recherche Approximate Nearest Neighbor pour trouver des éléments sémantiquement similaires, puis vous présentez ces données au LLM pour générer une réponse précise.

Zilliz aide-t-il à lutter contre les hallucinations liées à l'IA ?

Zilliz Cloud (et Milvus) contribue aux hallucinations de l'IA en stockant et en interrogeant une base de connaissances qui a été convertie en encastrements vectoriels. OSSChat est un exemple d'application qui montre comment une base de données vectorielle peut être utilisée pour réduire ces hallucinations. Voici quelques ressources supplémentaires sur la façon dont vous pouvez utiliser Zilliz pour réduire les hallucinations :

Contenu

Commencez gratuitement, évoluez facilement

Essayez la base de données vectorielle entièrement managée conçue pour vos applications GenAI.

Essayer Zilliz Cloud gratuitement

Partager cet article

Ressources connexes

Recherche de similarité vectorielle avec Milvus

Apprendre à construire un moteur de recherche par similarité sémantique

Introduction au chat sur les logiciels libres

Comment cette application démontre la nouvelle pile d'IA ChatGPT+ Base de données vectorielles + prompt-as-code

Présentation de GPTCache

Améliorer l'efficacité et la vitesse des applications basées sur le GPT en mettant en place un cache