Exa создает поисковую систему по сущностям для ИИ-агентов с Zilliz Cloud

<200 мс задержка поиска
Задержка нейронного поиска Exa сократилась с нескольких секунд до менее чем 200 мс благодаря гибридному поиску Zilliz
Высокая надежность
Практически нулевое количество операционных инцидентов, освобождающее время инженеров для работы над продуктом
Нулевое время простоя при изменениях схемы
Новые фильтруемые поля и метаданные можно добавлять без перестроения индексов или перевода коллекций в офлайн
We believe AI agents will become a fundamental interface for how people work, learn, and make decisions, and that only happens if those systems can access real-world information with speed, precision, and trust. That’s what we’re building at Exa. Aside from web search, Exa also operates entity search, and Zilliz Cloud has been an important part of that journey, giving us the retrieval performance and operational simplicity we need to scale our entity search product quickly and confidently.
Jeffrey Wang
Поиск для ИИ-агентов звучит как естественное расширение веб-поиска, но на практике он требует другого продуктового стандарта. Агентам нужны не просто ссылки; им нужна обоснованная, актуальная, структурированная информация, доставляемая достаточно быстро, чтобы поддерживать реальные рабочие процессы — от голосовых взаимодействий до задач глубокого исследования.
Exa создает именно такой поисковый движок для ИИ. Его Search API дает разработчикам доступ к высококачественному веб-поиску с низкой задержкой в широком диапазоне вычислительной задержки: от мгновенного поиска для голосовых агентов до более глубоких исследований со структурированными результатами и обогащениями. Exa обслуживает клиентов от AI-native стартапов, таких как Cursor и Lovable, до корпоративных компаний вроде AWS, и все они полагаются на обоснованный, реальный контекст для агентных рабочих процессов.
По мере того как Exa расширяется в область поиска сущностей для компаний, людей и кода, перед ней встала более специализированная инфраструктурная задача: как поддерживать гибридное извлечение, богатую фильтрацию по метаданным, частые обновления и задержку на уровне миллисекунд, не отвлекая инженерные усилия от основного поискового движка. Именно такую роль в приведенной ниже истории играет Zilliz Cloud (полностью управляемый Milvus).
| Низкая задержка поиска 200 мс | Гибридный поиск, объединяющий dense-векторы, sparse-векторы, RRF-реранжирование и фильтры метаданных в одном вызове API. Exa Instant снизил задержку нейронного поиска с секунд до менее чем 200 мс |
| Высокая надежность | Управляемый сервис обеспечил почти нулевое число операционных инцидентов, высвободив инженерное время для работы над продуктом |
| Нулевое время простоя при изменениях схемы | Новые фильтруемые поля и метаданные можно добавлять без перестроения индексов или вывода коллекций из эксплуатации |
Ниже приведен сценарий беседы с Exa о ее продуктовой миссии, переходе от общего веб-поиска к поиску сущностей и о том, как Zilliz Cloud вписывается в эту эволюцию.
1. Продуктовое обещание Exa: обоснованный поиск для ИИ-агентов
Мы начали с просьбы к Exa описать продукт, который она создает, и клиентов, которых она обслуживает, потому что этот контекст объясняет, почему качество извлечения и задержка не являются для компании второстепенными вопросами.
Q: Какой продукт или услугу предоставляет Exa и кто ваши основные клиенты?
Exa: Exa создает поисковый движок для ИИ. Мы построили Search API, который позволяет разработчикам получать доступ к высококачественному веб-поиску с низкой задержкой во всех их агентах. Наш API предлагает поиск по всему спектру вычислительной задержки: от мгновенных (<200 мс) поисков для голосовых агентов до глубокого исследования со структурированными результатами и обогащениями. Мы специализируемся на поиске по коду, низкой задержке и поиске людей/компаний, с выделенными фрагментами, которые обеспечивают эффективность использования токенов.
Мы построили наш поисковый движок с нуля, используя новые нейронные архитектуры, вместо того чтобы полагаться на устаревшие поисковые системы. Создание собственного поискового движка требует всего — от обучения embedding-моделей и reranker-моделей до crawling и индексации миллиардов веб-страниц. Такое сквозное владение позволяет нам оптимизировать каждый уровень стека по качеству и скорости. Например, в недавнем запуске Exa Instant мы достигли задержки поиска <200 мс — значительного улучшения, которое делает нейронный поиск жизнеспособным как примитив реального времени для ИИ-агентов. Сочетание качества, скорости и настраиваемости является ключевым отличием.
Наши клиенты варьируются от AI-native компаний, таких как Cursor и Lovable, до крупных предприятий. Любой компании, использующей агентов для выполнения интеллектуальной работы, нужен обоснованный контекст, чтобы реагировать на реальный мир, поэтому, независимо от размера компании, мы работаем с командами, которые делают приоритетом агентные рабочие процессы.
2. Переломный момент: от веб-поиска к поиску сущностей
Этот продуктовый контекст также проясняет, почему решение Exa по базе данных не было связано с заменой ее основного поискового стека. Векторный поиск уже был фундаментальным для компании. Настоящее изменение произошло, когда поиск сущностей ввел новые ограничения.
В: На каком этапе развития вашего продукта вы поняли, что вам нужна векторная база данных?
Exa: Учитывая, что наша поисковая система была построена на эмбеддингах и векторном сходстве, векторный поиск был неотъемлемой частью технологического стека Exa. По мере того как мы расширялись в сторону поиска сущностей, нам понадобилось обновить инфраструктуру нашей векторной базы данных, чтобы поддерживать структурированные выходные данные и обогащения, которые мы теперь предлагали.
Поиск сущностей требует богатых схем метаданных, частых обновлений данных и управляемой масштабируемости. Наша внутренняя база данных была оптимизирована под эти обновленные ограничения, но мы хотели дополнительно повысить скорость итераций на этом уровне поиска сущностей, что побудило нас использовать Zilliz Cloud. Наш основной веб-индекс остается на нашей внутренней инфраструктуре, а Zilliz Cloud был подключен специально для обеспечения работы этого уровня поиска сущностей.
В: С какими вызовами или требованиями вы столкнулись при использовании предыдущего решения?
Exa: Когда мы начали создавать поиск сущностей, требования были совсем другими: гибридный поиск, объединяющий плотные и разреженные векторы, богатые и часто меняющиеся схемы метаданных, а также операционные накладные расходы на управление несколькими специализированными коллекциями. Мы искали управляемое решение, которое позволило бы нашим инженерам быстро итерировать и поддерживать быстрые ответы в масштабе.
В: Какие конкретные сценарии использования вы решаете с помощью векторного поиска/векторной базы данных?
Exa: Сегодня Zilliz Cloud обеспечивает работу нашего уровня поиска сущностей, выступая одновременно в роли основного индекса и кэша актуальности для коллекций сущностей, в то время как наш основной веб-индекс работает на отдельной внутренней инфраструктуре. Каждый вертикальный сегмент требует низколатентного поиска с фильтрацией по часто обновляемым данным, где управляемые возможности гибридного извлечения и hot-upsert от Zilliz позволяют сохранять результаты свежими без перестроения индексов. Эти вертикали напрямую питают наш Search API, поэтому скорость и полнота поиска критически важны для бизнеса.
3. Что Exa требовалось от управляемого уровня векторного извлечения
Когда поиск сущностей стал отдельным уровнем, оценка по-настоящему сводилась к соответствию: сможет ли управляемая система поддерживать планку качества поиска Exa, не замедляя команду и не вынуждая идти на архитектурные компромиссы?
В: Какие векторные базы данных вы оценивали перед выбором Zilliz Cloud? Каковы были ключевые критерии вашей оценки?
Exa: Когда мы начали создавать поиск сущностей, требования были совсем другими: гибридный поиск, объединяющий плотные и разреженные векторы, богатые, часто меняющиеся схемы метаданных, а также операционные накладные расходы на управление несколькими специализированными коллекциями. Мы искали управляемое решение, которое позволило бы нашим инженерам быстро итерировать и поддерживать быстрые ответы в масштабе.
Мы изучили все основные варианты векторных баз данных на рынке. Наши ключевые критерии были следующими:
Поддержка гибридного поиска: нативная возможность объединять плотные семантические векторы с разреженными ключевыми векторами в одном запросе, со встроенным реранжированием
Задержка запросов: стабильно быстрые ответы по коллекциям с десятками миллионов векторов
Богатая фильтрация по метаданным: сложные фильтры по структурированным полям без снижения производительности поиска
Масштабируемость: бесшовное масштабирование по мере добавления новых вертикалей и источников данных
Zilliz Cloud соответствовал всем требованиям, а его производительность в бенчмарках гибридного поиска была явно впереди конкурентов.
В: Как вы впервые узнали о Zilliz Cloud / Milvus?
Exa: Мы давно знали о Milvus, поскольку это одна из самых зрелых open-source векторных баз данных, и команде, которая живет и дышит векторным поиском, трудно ее не заметить. Когда мы начали прорабатывать инфраструктуру поиска сущностей, Zilliz Cloud выделился как естественное управляемое предложение поверх Milvus с улучшениями производительности корпоративного уровня.
В: Что выделялось в Zilliz Cloud во время вашей оценки? Каковы были главные причины, которые привели вас к выбору Zilliz Cloud?
Exa: Сразу выделились несколько вещей.
Нативный гибридный поиск: Zilliz Cloud поддерживает поиск по плотным и разреженным векторам в одном API-вызове, со встроенными стратегиями переранжирования (RRF, взвешенное). Это было жестким требованием для нескольких конкурентов, а мы не поддерживали это нативно.
Производительность в масштабе — их движок индексирования Cardinal обеспечивает стабильно быстрое время выполнения запросов даже по мере роста наших коллекций до сотен миллионов векторов.
Зрелая фильтрация — возможность объединять векторный поиск со сложными фильтрами метаданных в одном запросе без резкого падения производительности.
С точки зрения решающих факторов для внедрения:
Скорость — задержка запросов Zilliz Cloud соответствовала нашим строгим требованиям к поиску в продакшене. Наши пользователи ожидают результаты за миллисекунды, и Zilliz способен это обеспечить.
Возможности гибридного поиска — способность объединять плотный семантический поиск с разреженным сопоставлением ключевых слов BM25 и применять переранжирование Reciprocal Rank Fusion (RRF) в одном API-вызове была важна для качества поиска.
Операционная простота — как полностью управляемый сервис, Zilliz Cloud позволяет нашей команде сосредоточиться на создании более качественного поискового опыта и быстро итеративно улучшать инфраструктуру векторных баз данных в масштабе.
4. Как архитектура Zilliz и Exa сочетается
Q: Как Zilliz Cloud вписывается в вашу архитектуру?
Exa: Наша архитектура поиска сущностей состоит из трех уровней: ingestion, поиск и API.
В ingestion мы обогащаем и векторизуем данные сущностей с помощью собственных ML-пайплайнов, затем upsert плотные и разреженные векторы в Zilliz Cloud.
В поиске наш бэкенд генерирует embeddings из пользовательских запросов и отправляет гибридные поисковые запросы в Zilliz Cloud, объединяя семантическое и ключевое сопоставление с переранжированием RRF.
На уровне API результаты обогащаются структурированными метаданными и предоставляются через наш Search API и продукт Websets. Zilliz Cloud находится в ядре retrieval для этого рабочего процесса: он хранит все векторы и метаданные сущностей и обрабатывает низколатентный поиск. Наш основной веб-индекс построен и управляется на отдельной собственной инфраструктуре.
Q: Каким был опыт вашей команды при использовании Zilliz Cloud или Milvus?
Exa: API интуитивно понятен, документация надежная, а система показала себя надежной в продакшене. Кривая обучения была минимальной, потому что концепции Milvus: collections, indexes, search params — хорошо соответствуют тому, как мы уже думаем о векторном поиске. Управляемый характер Zilliz Cloud означает, что у нас было очень мало операционных инцидентов, с которыми пришлось разбираться.
Q: Каким был опыт интеграции Zilliz Cloud с AWS или другими облачными сервисами?
Exa: Бесшовным. Мы запускаем нашу инфраструктуру преимущественно на AWS, и Zilliz Cloud аккуратно вписывается в этот AWS-native стек. Поскольку он работает на AWS, сетевая задержка между нашими сервисами EKS и Zilliz Cloud минимальна.
5. Что изменилось после внедрения
Q: Какие 3 главных преимущества вы увидели? Можете ли вы поделиться измеримыми метриками или улучшениями?
Exa: Первым преимуществом стала скорость разработки: управляемый сервис и понятный API позволили нашей команде быстро запускать новые вертикали поиска сущностей без создания или управления дополнительной инфраструктурой.
Помимо этого, гибкость схемы и адаптивность были очень важны по мере развития этих вертикальных наборов данных, а качество поиска через autoindex также оказалось ценным на практике.
Q: Какие функции Zilliz Cloud вы считаете наиболее ценными?
Exa: В повседневном использовании больше всего выделяются две вещи.
Фильтрация без резкого падения производительности: сложные фильтры метаданных, наложенные поверх векторного поиска, с незначительным влиянием на задержку.
Быстрые запуски вертикалей: управляемое масштабирование позволяет нам быстро запускать новые поисковые вертикали без необходимости каждый раз поднимать новую инфраструктуру.
Начните работу с Zilliz Cloud
Zilliz — создатель Milvus, самой популярной в мире open-source векторной базы данных, и Zilliz Cloud, полностью управляемого сервиса векторных баз данных, построенного на Milvus. Zilliz Cloud позволяет организациям создавать готовые к production AI-приложения с высокопроизводительным векторным поиском, гибридным извлечением, а также корпоративного уровня безопасностью и соответствием требованиям.
- Начните бесплатно работать с Zilliz Cloud с кредитами на сумму $100 при регистрации с использованием корпоративного email
- 1. Продуктовое обещание Exa: обоснованный поиск для ИИ-агентов
- 2. Переломный момент: от веб-поиска к поиску сущностей
- 3. Что Exa требовалось от управляемого уровня векторного извлечения
- 4. Как архитектура Zilliz и Exa сочетается
- 5. Что изменилось после внедрения
- Начните работу с Zilliz Cloud
Контент
Пример использования
Отрасль
ИИ-инфраструктура


