Bosch добивается снижения затрат на 80% и оптимизации эффективности поиска с помощью Milvus

80%
Снижение затрат на сбор данных
~$1,4 млн
Снижение ежегодных затрат на хранение
На уровне миллисекунд
Поиск среди миллиардов точек данных с масштабируемой архитектурой
When we identify a need for specific data, we can often find the required data in our database the same day using text or image search with Milvus. This greatly improves our data processing efficiency and has a positive effect on our business operations.
Mr. Zhang
О BOSCH
Штаб-квартира BOSCH находится в Германии; компания является мировым лидером в области автомобильных технологий и компонентов, известным своими передовыми инновациями и многолетней экспертизой в сфере автономного вождения. Она предоставляет передовые решения для автономного вождения, включая продвинутые системы помощи водителю (ADAS), такие как адаптивный круиз-контроль, помощь в удержании полосы движения и системы автоматической парковки, которым доверяют ведущие автопроизводители по всему миру.
Задача: получение наборов изображений для краевых случаев
В автономном вождении «краевые случаи» означают редкие, неожиданные или экстремальные ситуации, такие как внезапный густой туман, сильный дождь, снежные бури или неожиданные препятствия, например пешеходы, животные или нестандартные транспортные средства. Эти ситуации создают значительные трудности для систем восприятия автономных транспортных средств, включая радары, камеры и LiDAR.
Автомобильные инженеры должны гарантировать, что системы автономного вождения смогут безопасно и надежно справляться с такими пограничными сценариями. Однако получение наборов изображений, точно представляющих эти сложные ситуации, является проблематичным, поскольку такие случаи происходят нечасто и часто требуют специальных условий или сред для воспроизведения. Сбор такого набора изображений «краевых случаев» традиционными методами сбора данных занимает много времени и требует больших затрат, создавая значительное препятствие для разработчиков, стремящихся повысить безопасность и надежность автономных транспортных средств.
Команда Intelligent Drive Control компании BOSCH столкнулась именно с этой проблемой. Им нужно было найти способ эффективно и экономически выгодно собирать наборы изображений, которые могли бы точно отображать эти сложные ситуации. Без таких данных было бы невозможно всесторонне тестировать и совершенствовать автономные системы, чтобы они безопасно работали в любых условиях.
Изучение AI-решений: интеграция LLM и векторных баз данных
Чтобы справиться со своими задачами, команда Intelligent Drive Control компании BOSCH на протяжении многих лет изучала различные стратегии.
Изначально команда собирала данные для краевых случаев вручную. Такой подход требовал большого парка автомобилей и значительных человеческих ресурсов, чтобы ожидать появления этих редких сценариев и собирать данные. Это занимало много времени, было неэффективно и зависело от случайных встреч с нужными условиями, что приводило к длительным срокам проектов.
Затем команда обратилась к графам знаний (KG), чтобы маркировать точки данных конкретными атрибутами или классификациями. Хотя такой подход упростил организацию, извлечение и анализ данных, огромное разнообразие краевых случаев сделало уникальную маркировку каждого из них колоссальной задачей.
Оба метода имели недостатки, включая высокие затраты, низкую эффективность и ограниченное покрытие.
С развитием AI-технологий, особенно больших языковых моделей (LLMs), таких как ChatGPT, векторных баз данных и генерации с дополнением извлечением (RAG), BOSCH начала изучать более эффективные решения для преодоления своих задач. Они использовали большие визуальные модели (LVMs) и большие мультимодальные модели (LMMs), чтобы преобразовывать собранные изображения в векторные эмбеддинги. Используя векторную базу данных, они могли выполнять высокоэффективный поиск «текст-в-изображение» или «изображение-в-изображение».
Команда быстро определила подходящие модели LMM и LVM для эмбеддинга изображений. Однако настоящая сложность заключалась в масштабировании поиска по векторному сходству, что сделало векторные базы данных важнейшим компонентом этого инновационного решения.
Путь к выбору Milvus в качестве решения для поиска по сходству
BOSCH полагается на предварительно обученные модели ИИ с миллиардами параметров и размерностью признаков, превышающей 1 000. Например, при 1 024-мерном векторе признаков каждое значение с плавающей точкой (4 байта) требует около 4 КБ памяти. При работе с массивными наборами данных такое требование к хранению может привести к огромному потреблению ресурсов, повышая как затраты на хранение, так и вычислительные расходы.
Объем данных изображений BOSCH огромен — в настоящее время он составляет десятки миллиардов и продолжает расти. После кластеризации и дедупликации объем данных, необходимых для поиска по сходству в векторной базе данных, по-прежнему исчисляется миллиардами.
Чтобы решить эту задачу, BOSCH внедрила технологии квантованного индексирования и шардирования для минимизации использования ресурсов и повышения эффективности обработки данных. Квантованное индексирование идеально подходит для эффективного хранения крупномасштабных данных и индексирования высокоразмерных признаков. Шардирование справляется с растущими объемами данных, делая возможным крупномасштабный поиск в реальном времени и оптимизируя использование вычислительных ресурсов. Команда изучила несколько подходов:
Индексирование графов HNSW (Hierarchical Navigable Small Worlds): Многие системы вопросов и ответов используют индексирование графов HNSW для задач обработки естественного языка (NLP). Хотя это популярный и простой метод, HNSW требует хранения высокоразмерных признаков непосредственно в библиотеке алгоритма, что приводит к высокому потреблению ресурсов и затратам.
Плагины векторного поиска поверх традиционных баз данных: Добавление ****векторных полей в традиционные реляционные базы данных — одно из доступных решений для векторного поиска. Однако для алгоритмов квантованного индексирования обновления шардирования требуют повторного обучения кодовых книг, что добавляет сложности. В результате традиционные базы данных с функциональностью векторного поиска обычно поддерживают только индексирование HNSW, которое не соответствует потребностям BOSCH в крупномасштабной обработке и поиске векторных данных.
Главный инженер-программист BOSCH, инженер Чжан, объяснил: «Нам нужна технология индексирования, которая может обрабатывать сложные поисковые требования и генеративные модели, снижать затраты на обучение, повышать эффективность обновлений и гибко адаптироваться к меняющимся данным и потребностям запросов».
Специализированная векторная база данных оказалась лучшим решением для потребностей BOSCH. После оценки различных вариантов BOSCH выбрала Milvus в качестве своего решения для векторного поиска.
Результаты: снижение затрат на 80% и оптимизированная эффективность поиска
Milvus — это векторная база данных с открытым исходным кодом, которая может хранить, индексировать и извлекать миллиарды векторов за миллисекунды. Даже при огромных и растущих объемах данных BOSCH Milvus сохраняет сверхвысокую производительность. Самое главное, технология квантованного индексирования Milvus значительно снижает потребление ресурсов хранения и вычислений, облегчая BOSCH управление крупномасштабными наборами данных.
Снижение затрат на сбор данных на 80%
Эффективные возможности поиска по сходству Milvus позволяют BOSCH извлекать 70–80% необходимых данных о редких случаях из существующих баз данных, сокращая потребность в сборе новых данных. Кроме того, Milvus обеспечивает почти мгновенное извлечение, если необходимые данные уже находятся в базе данных, значительно повышая эффективность интеллектуального анализа данных.
Чжан объяснил: «Когда мы выявляем потребность в конкретных данных о редких случаях, мы часто можем найти необходимые данные в нашей базе данных в тот же день, используя текстовый или графический поиск с Milvus. Это значительно повышает эффективность нашей обработки данных и положительно влияет на наши бизнес-операции».
Сокращение ежегодных затрат на хранение почти на 1,4 млн долларов США
Снижение потребности во внешнем сборе данных также существенно сократило затраты на хранение. Чжан добавил: «Опора исключительно на внешний сбор данных могла бы обходиться почти в 1,4 миллиона долларов ежегодно».
Оптимизированная эффективность поиска
Технология квантованного индексирования Milvus значительно снижает потребление ресурсов хранения и вычислений. Теперь BOSCH может обрабатывать данные более гибко и эффективно, преодолевая ограничения производительности традиционных баз данных. Milvus также предлагает сегментированные и шардированные методы поиска, повышая эффективность и решая текущие проблемы с крупномасштабными и высокоразмерными данными.
Извлечение на уровне миллисекунд для миллиардов точек данных благодаря масштабируемой архитектуре
Бизнес BOSCH в области автономного вождения основан на облачных технологиях. Облачная нативная архитектура Milvus упрощает его развертывание и масштабирование. Она обеспечивает отличную масштабируемость, что критически важно для операций BOSCH с данными миллиардного масштаба. Когда набор данных расширяется, команде достаточно одного клика, чтобы масштабировать необходимые ресурсы. Чжан отметил: «Даже при многочисленных одновременных поисковых запросах мы не заметили никакого замедления скорости поиска».
Активная поддержка сообщества
Milvus — одна из самых популярных, быстро развивающихся и зрелых векторных баз данных с открытым исходным кодом, с большим и активным сообществом пользователей и разработчиков по всему миру. Чжан прокомментировал: «Сообщество Milvus очень активно. Когда у нас возникали проблемы, мы получали оперативные ответы от сообщества».
Планы на будущее: изучение возможностей гибридного поиска Milvus
Чтобы обеспечить разнообразие данных, необходимы тысячи образцов изображений. В настоящее время BOSCH отдает приоритет поиску «текст-в-изображение», прибегая к поиску «изображение-в-изображение», когда результаты по тексту недостаточно хороши. Поддержка Milvus мультивекторных столбцов и гибридного поиска делает поиск «изображение-в-изображение» по запросу более осуществимым. Например, объединение изображений погоды с изображениями конусов помогает искать различные погодные условия с участием конусов, а наложение треугольных дорожных знаков с описательным текстом — искать разные функции предупреждения. Это направление BOSCH и Milvus продолжат исследовать вместе.
Раскрытие полного потенциала Milvus в автономном вождении
Milvus — это не просто инструмент, а стратегический союзник BOSCH в сфере автономного вождения. С Milvus BOSCH может глубже погружаться в данные и использовать их возможности, получая важнейшее преимущество в стремлении к более умному и безопасному вождению. Внедрение Milvus преобразило подход BOSCH к работе с данными, сделав каждый этап — от сбора до обработки и применения — более эффективным и точным.
Глядя в будущее, BOSCH стремится изучить больше передовых возможностей Milvus, продвигая следующее поколение более безопасного, умного и удобного опыта вождения.
- О BOSCH
- Задача: получение наборов изображений для краевых случаев
- Изучение AI-решений: интеграция LLM и векторных баз данных
- Путь к выбору Milvus в качестве решения для поиска по сходству
- Результаты: снижение затрат на 80% и оптимизированная эффективность поиска
- Планы на будущее: изучение возможностей гибридного поиска Milvus
- Раскрытие полного потенциала Milvus в автономном вождении
Контент
Пример использования
Отрасль
Автомобильная отрасль
Even with numerous concurrent searches, we didn’t notice any slowdown in search speed with Milvus.
Mr. Zhang


