Kotaemon and Zilliz Cloud Integration
Kotaemon and Zilliz Cloud integrate to build AI-powered document QA applications, combining Kotaemon's open-source customizable RAG UI with Zilliz Cloud's scalable vector database for efficient hybrid retrieval, multi-modal question-answering, and advanced citations with document previews.
Utilisez cette intégration gratuitementQu’est-ce que Kotaemon
Kotaemon est une interface utilisateur RAG open source, épurée et personnalisable pour discuter avec vos documents. Conçue à la fois pour les utilisateurs finaux et les développeurs, elle fournit une interface web de QA documentaire personnalisable et multi-utilisateur prenant en charge les LLM locaux et basés sur des API. Elle offre un pipeline RAG hybride avec recherche en texte intégral et vectorielle, une QA multimodale pour les documents contenant des figures et des tableaux, ainsi que des citations avancées avec aperçus des documents. Elle prend en charge des méthodes de raisonnement complexes comme ReAct et ReWOO, et fournit des paramètres configurables pour la recherche et la génération.
En s’intégrant à Zilliz Cloud (Milvus entièrement géré), Kotaemon accède à une base de données vectorielle entièrement gérée et évolutive qui renforce ses capacités de recherche, permettant une recherche de similarité efficace dans de grandes collections de documents pour des scénarios de recherche documentaire en entreprise, d’assistance à la recherche et d’analyse collaborative de documents.
Avantages de l’intégration de Kotaemon + Zilliz Cloud
- QA documentaire multi-utilisateur avec stockage évolutif : L’interface web multi-utilisateur de Kotaemon, associée au stockage vectoriel évolutif de Zilliz Cloud, permet aux équipes de discuter collaborativement avec des documents et de les analyser à grande échelle.
- Récupération hybride pour une meilleure précision : L’intégration prend en charge le RAG hybride combinant recherche plein texte et recherche vectorielle alimentées par Zilliz Cloud, améliorant la précision de la récupération par rapport aux approches à méthode unique.
- Prise en charge de la QA multimodale : Kotaemon traite les documents comportant des figures et des tableaux grâce à la question-réponse multimodale, tandis que Zilliz Cloud stocke et récupère efficacement les embeddings correspondants.
- Citations avancées avec aperçus de documents : Le système fournit des citations détaillées avec des aperçus de documents et des scores de confiance, soutenus par la récupération vectorielle rapide et précise de Zilliz Cloud.
- Configuration flexible des modèles : Les utilisateurs peuvent configurer et alterner entre plusieurs LLM et modèles d’embedding, tandis que Zilliz Cloud gère de manière transparente la couche de stockage vectoriel.
Fonctionnement de l’intégration
Kotaemon sert de couche applicative et d’interface utilisateur, fournissant une interface web pour le téléversement de documents, la QA basée sur le chat, la gestion des conversations et l’affichage des résultats avec citations. Il gère le traitement des documents, la génération d’embeddings et orchestre le pipeline RAG avec la prise en charge de méthodes de raisonnement complexes.
Zilliz Cloud sert de couche de base de données vectorielle, stockant et indexant les embeddings de documents générés par Kotaemon pour une recherche de similarité rapide. Il fournit une récupération haute performance à faible latence, permettant une récupération efficace des documents dans de vastes bases de connaissances.
Ensemble, Kotaemon et Zilliz Cloud créent une solution complète de QA documentaire : les utilisateurs téléversent des documents via l’interface web de Kotaemon, qui les traite et les intègre dans Zilliz Cloud. Lorsque les utilisateurs posent des questions, le pipeline de récupération hybride de Kotaemon exploite la recherche vectorielle de Zilliz Cloud en parallèle de la recherche plein texte afin de trouver le contexte le plus pertinent, puis génère des réponses avec des citations avancées et des scores de confiance.
Guide étape par étape
1. Installer Kotaemon
Nous recommandons d’installer Kotaemon de cette manière :
# optional (setup env) conda create -n kotaemon python=3.10 conda activate kotaemon git clone https://github.com/Cinnamon/kotaemon cd kotaemon pip install -e "libs/kotaemon[all]" pip install -e "libs/ktem"Outre cette méthode, il existe d’autres façons d’installer Kotaemon. Vous pouvez consulter la documentation officielle pour plus de détails.
2. Définir Milvus comme stockage vectoriel par défaut
Pour remplacer le stockage vectoriel par défaut par Milvus, vous devez modifier le fichier
flowsettings.pyen remplaçantKH_VECTORSTOREpar :"__type__": "kotaemon.storages.MilvusVectorStore"3. Définir les variables d’environnement
Vous pouvez configurer les modèles via le fichier
.envavec les informations nécessaires pour se connecter aux LLM et aux modèles d’embedding. p. ex. OpenAI, Azure, Ollama, etc.4. Exécuter Kotaemon
Après avoir défini les variables d’environnement et modifié le stockage vectoriel, vous pouvez exécuter Kotaemon en lançant la commande suivante :
python app.pyLe nom d’utilisateur / mot de passe par défaut sont :
admin/admin5. Ajouter vos modèles d’IA
Dans l’onglet
Resources, vous pouvez ajouter et définir vos LLM et modèles d’embedding. Vous pouvez ajouter plusieurs modèles et les définir comme actifs ou inactifs. Vous devez en fournir au moins un. Vous pouvez également fournir plusieurs modèles pour permettre de basculer entre eux.6. Téléverser vos documents
Afin de faire du QA sur vos documents, vous devez d’abord les téléverser dans l’application. Accédez à l’onglet
File Index, où vous pouvez téléverser et gérer vos documents personnalisés.Par défaut, toutes les données de l’application sont stockées dans le dossier
./ktem_app_data. Les données de la base de données Milvus sont stockées dans./ktem_app_data/user_data/vectorstore. Vous pouvez sauvegarder ou copier ce dossier pour déplacer votre installation vers une nouvelle machine.7. Discuter avec vos documents
Revenez maintenant à l’onglet
Chat. L’onglet Chat se compose de 3 zones : le panneau des paramètres de conversation, où vous gérez les conversations et les références de fichiers ; le panneau de discussion pour interagir avec le chatbot ; et le panneau d’information, qui affiche les preuves à l’appui, les scores de confiance et les évaluations de pertinence des réponses.Vous pouvez sélectionner vos documents dans le panneau des paramètres de conversation. Il vous suffit ensuite de démarrer le RAG avec vos documents en tapant un message dans la zone de saisie et en l’envoyant au chatbot.
En savoir plus
- Kotaemon RAG avec Milvus — Tutoriel officiel de Milvus pour personnaliser Kotaemon avec Milvus
- Dépôt GitHub de Kotaemon — Code source de Kotaemon et ressources communautaires
- Documentation officielle de Kotaemon — Guide d’utilisation officiel de Kotaemon
- Créer des applications d’IA avec Milvus : tutoriels et notebooks — Collection Zilliz de tutoriels et de notebooks Milvus
- Créer des RAG avancés et des requêtes multimodales avec Milvus et Friendli AI — Blog Zilliz sur les RAG avancés et les requêtes multimodales


