WhyHow
Build more controlled retrieval workflows within your RAG pipeline with WhyHow and Milvus or Zilliz Cloud
Используйте эту интеграцию бесплатноЧто такое WhyHow?
WhyHow - это платформа, которая предоставляет разработчикам строительные блоки для организации, контекстуализации и надежного извлечения неструктурированных данных для выполнения сложных задач по расширенному поиску (RAG). Пакет Rule-based Retrieval Package - это пакет Python, разработанный WhyHow, который помогает разработчикам создавать более точные рабочие процессы поиска в рамках RAG, добавляя расширенные возможности фильтрации. Этот пакет интегрируется с OpenAI для генерации текста и Milvus и Zilliz Cloud (полностью управляемый Milvus) для эффективного хранения векторов и поиска сходства.
Зачем интегрировать WhyHow и Milvus/Zilliz?
Retrieval Augmented Generation (RAG) - это передовая технология, которая улучшает большие языковые модели (LLMs), предоставляя контекстную информацию запроса для получения более точных ответов. Однако простой конвейер RAG иногда не может последовательно получать правильные фрагменты данных. Эта проблема может быть связана с "черным ящиком" поиска и генерации ответов LLM, плохо сформулированными запросами пользователей, дающими неоптимальные результаты из векторной базы данных, или необходимостью включать в ответы контекстуально релевантные, но семантически несхожие данные.
Чтобы преодолеть эти проблемы, нам необходимо иметь больший контроль над получением необработанных фрагментов данных. Интегрировав WhyHow и Milvus/Zilliz, мы можем создать решение для извлечения данных на основе правил. Этот подход позволяет определить и сопоставить конкретные правила с соответствующими фрагментами данных перед выполнением поиска по сходству, что повышает контроль над рабочим процессом поиска. Реализация этих правил сужает область запросов до более целевого набора фрагментов, увеличивая шансы на получение релевантных данных для создания точных ответов. При дальнейшей настройке запросов качество результатов можно постоянно улучшать.
Как работает интеграция WhyHow и Milvus/Zilliz
Поисковое решение на основе правил, созданное с помощью WhyHow и Milvus/Zilliz, выполняет следующие задачи:
Создание хранилища векторов: Эта интеграция создает коллекцию Milvus для хранения вкраплений чанков.
Разделение, чанкинг и встраивание: Когда вы загружаете документы, интеграция автоматически разделяет, разбивает на части и создает вкрапления документов перед их загрузкой в Milvus или Zilliz Cloud. Этот основанный на правилах пакет поиска в настоящее время поддерживает PyPDFLoader и RecursiveCharacterTextSplitter от LangChain для обработки PDF, извлечения метаданных и разбиения на куски. Для встраивания поддерживается модель OpenAI text-embedding-3-small.
Вставка данных: Загрузка вкраплений и метаданных в Milvus или Zilliz Cloud.
Автофильтрация: Используя заданные пользователем правила, интеграция автоматически строит фильтр метаданных для сужения запроса к хранилищу векторов.
Рабочий процесс этой интеграции выглядит следующим образом:
Как работают вместе WhyHow и Zilliz Cloud.png
- Исходные данные преобразуются в векторные вкрапления с помощью модели вкрапления OpenAI.
- Векторные вкрапления попадают в Milvus или Zilliz Cloud для хранения и поиска.
- Запрос пользователя также преобразуется в векторные эмбеддинги и отправляется в Milvus или Zilliz Cloud для поиска наиболее релевантных результатов.
- WhyHow устанавливает правила и добавляет фильтры к векторному поиску.
- Полученные результаты и исходный запрос пользователя отправляются в LLM.
- LLM генерирует более точные результаты и отправляет их пользователю.
Как использовать WhyHow и Milvus/Zilliz Cloud