Как TAL Education Group масштабирует обучение на базе ИИ с помощью Milvus

Миллисекундный семантический поиск
Мгновенный поиск по миллиардам векторов вместо медленного нечеткого сопоставления
Более высокая точность оценивания
Более точное семантическое понимание открытых и мультимодальных ответов студентов
Более высокое качество рекомендаций
Векторный поиск с высокой полнотой выявляет релевантный контент, который пропускает поиск по ключевым словам
Сквозное ускорение
Более быстрые конвейеры оценки, извлечения и рекомендаций со сниженной общей задержкой
О TAL Education Group
TAL Education Group (NYSE: TAL) — одна из ведущих образовательных технологических компаний Азии, обслуживающая миллионы учащихся и семей. Основанная в 2003 году и вышедшая на Нью-Йоркскую фондовую биржу в 2010 году, TAL выросла из своего репетиторского бизнеса Xueersi в широкий портфель продуктов для цифрового обучения, включая Xueersi.com, Xueersi Smart Devices, MathGPT и другие технологически ориентированные образовательные бренды, — все они разработаны для поддержки учащихся дома и в средах цифрового класса.
По мере того как TAL все глубже развивала обучение на базе ИИ — охватывающее персонализированное репетиторство, автоматизированную проверку, рекомендации контента и мультимодальный поиск знаний, — компании потребовалась новая инфраструктура данных, способная поддерживать эти ресурсоемкие вычислительные нагрузки в масштабе. Выбрав Milvus в качестве основы для своей платформы векторного поиска, TAL получила производительность, масштабируемость и гибкость, необходимые для более быстрой проверки, более точных рекомендаций и более интеллектуального семантического поиска во всех своих продуктах. Сейчас Milvus играет ключевую роль в поддержке более широкой миссии TAL: предоставлять высококачественный, технологически усиленный учебный опыт, доступный, эффективный и результативный для каждого учащегося.
Проблемы, с которыми сталкиваются учебные системы TAL на базе ИИ
TAL внедряет ИИ в нескольких ключевых образовательных сценариях — автоматизированной проверке, рекомендациях учебных ресурсов и векторном поиске документов. Но по мере масштабирования этих сервисов компания быстро достигла пределов традиционных систем данных. Современное онлайн-образование генерирует огромные объемы сложного мультимодального контента, а проверка на базе ИИ требует как высокой пропускной способности, так и глубокого понимания ответов учащихся. Эти нагрузки выявили структурные проблемы, которые устаревшая инфраструктура просто не могла решить.
1. Взрывной рост мультимодальных данных
TAL ежедневно обрабатывает сотни тысяч новых вопросов и ответов по предметам, уровням обучения и форматам, включая изображения, диаграммы и рукописные формулы. Этот постоянный приток данных выводит традиционные базы данных за пределы их возможностей по эффективной индексации и извлечению данных. По мере роста цифровых учебных платформ TAL серверная часть должна бесшовно масштабироваться, чтобы поддерживать растущие требования к хранению, высокопроизводительный векторный поиск и внезапные всплески трафика во время экзаменов и пиковых периодов обучения — и все это без ущерба для производительности или доступности.
2. Операционная неэффективность в конвейере проверки
Проверка человеком не успевает за масштабом современного онлайн-обучения. Оценка одного теста может занимать у преподавателя 15–20 минут, а субъективные вопросы часто приводят к несогласованным оценкам у разных проверяющих. В масштабе TAL это приводит к узким местам в проверке и отнимает ценное время преподавателей, которое можно было бы перенаправить на персонализированное обучение.
Кроме того, TAL поддерживает обширную библиотеку объяснений, решений и учебных материалов, но эти активы разбросаны по разным системам. Без интеллектуального поиска высококачественные ресурсы остаются недостаточно используемыми, создавая разрывы между созданием контента и реальными потребностями учащихся.
3. Высокие требования к точности обратной связи на базе ИИ
Проверка с помощью ИИ должна делать больше, чем сопоставлять ключевые слова, — она должна понимать смысл. Системам TAL необходимо выявлять семантическую эквивалентность, интерпретировать разнообразные формулировки и оценивать учащихся справедливо и последовательно. Любые сгенерированные объяснения должны быть точными, педагогически обоснованными и соответствующими возрасту. Для поддержки этого TAL требуется надежный граф знаний, который связывает каждый вопрос с соответствующими понятиями и отображает их взаимосвязи. Традиционные системы не предназначены для поддержки такого уровня семантического рассуждения в масштабе.
Обеспечение работы систем проверки и обучения TAL на базе ИИ с помощью Milvus
По мере того как TAL масштабировала свои сервисы проверки и обучения на базе ИИ, ей понадобилась векторная инфраструктура, способная поддерживать массивные рабочие нагрузки с эмбеддингами, обеспечивая высокую точность и отклик в реальном времени. После оценки нескольких решений TAL выбрала Milvus в качестве основного движка своей платформы векторных данных.
Поверх Milvus TAL построила модульную архитектуру, которая обеспечивает высокое качество данных, бесшовную интеграцию с приложениями и непрерывное улучшение системы.
Конвейер обработки данных: чистые, согласованные, готовые к векторизации данные
Конвейер обработки данных TAL формирует основу всей системы. Вопросы, ответы и учебные материалы поступают из нескольких источников, включая API, пакетные загрузки и OCR-извлечение из изображений или рукописного текста. После поступления весь контент проходит нормализацию, извлечение признаков и проверки качества, прежде чем преобразуется в векторные эмбеддинги. Этот конвейер гарантирует, что всё, что хранится в Milvus, является чистым, согласованным и оптимизированным для высококачественного семантического поиска.
Векторная база данных Milvus: высокопроизводительный поиск в масштабе миллиардов
В основе архитектуры TAL находится векторная база данных Milvus, которая обеспечивает хранение векторов в масштабе миллиардов и высокопроизводительный семантический поиск. Распределённая архитектура Milvus и индексация Approximate Nearest Neighbor (ANN) позволяют TAL обслуживать запросы на сходство за миллисекунды — даже среди сотен миллионов и миллиардов эмбеддингов. Стратегия нескольких индексов в Milvus помогает TAL балансировать скорость и точность, тогда как MySQL хранит структурированные метаданные, такие как версии и сопоставления индексов. Это поддерживает тесную синхронизацию векторных и реляционных данных.
Сегодня это развертывание Milvus управляет 1B+ векторов в 20+ коллекциях, при этом один кластер обрабатывает миллионы поисковых запросов в день.
Прикладные сервисы: превращение векторного поиска в образовательный эффект
Уровень прикладных сервисов превращает возможности Milvus в реальный образовательный эффект.
Проверка ИИ: использует семантическое сходство для оценки ответов учащихся и генерации объяснений.
Рекомендации: находит похожие вопросы, адаптированные к уровню обучения и прогрессу учащегося.
Дедупликация контента: выявляет повторяющийся или избыточный контент для поддержания качества банка вопросов.
Каждый сервис зависит от способности Milvus обеспечивать быстрый и точный поиск в масштабе, гарантируя, что учащиеся и преподаватели получают своевременные, персонализированные и согласованные результаты.
Фреймворк оценки качества: замкнутый цикл для непрерывного улучшения
Чтобы поддерживать надежность в масштабе, TAL создала фреймворк непрерывной оценки качества во всей системе. Каждый результат проверки, сгенерированный ИИ, получает оценку уверенности на основе семантического сходства, исторической эффективности и отзывов преподавателей. Эти сигналы поступают в структурированный цикл обратной связи, который выявляет аномалии, корректирует логику выставления баллов, обновляет параметры модели и со временем улучшает качество поиска.
Этот механизм замкнутого цикла гарантирует, что система становится точнее по мере роста использования, а не деградирует при более высоких нагрузках.
Реальный прирост производительности и новые возможности благодаря Milvus
После развертывания Milvus в своих гибридных облачных средах TAL быстро увидела значительные улучшения в производительности системы и качестве образовательного опыта на базе ИИ.
Поиск за миллисекунды в масштабе миллиардов
Теперь Milvus обрабатывает миллиарды векторов с семантическим поиском на уровне миллисекунд, заменяя медленные методы нечеткого сопоставления, которые раньше сдерживали проверку ИИ, рекомендации и поиск контента. С внедрением Milvus результаты возвращаются быстрее, точность повышается, а преподаватели и учащиеся получают более согласованные ответы по всем направлениям.
Более высокая точность и большая стабильность
Векторный поиск по сходству Milvus дает TAL гораздо более глубокое понимание ответов учащихся. По сравнению с предыдущими системами Milvus обеспечивает:
Более точные результаты поиска, особенно для открытых и мультимодальных вопросов
Более качественный recall, выявляющий релевантный контент, который не может найти поиск по ключевым словам
Стабильная производительность на миллиардном масштабе, даже в пиковые экзаменационные периоды
Более быстрая сквозная обработка, снижающая задержку при оценивании и рекомендациях
Эти достижения повышают не только эффективность системы, но и качество обучения, позволяя ИИ лучше понимать намерения учащихся и отвечать с большей педагогической релевантностью.
Открытие новых возможностей ИИ во всей экосистеме
Помимо ускорения существующих процессов, Milvus обеспечил волну новой функциональности на обучающих платформах TAL:
AI Grading: Более точное семантическое сопоставление повышает согласованность оценивания и качество объяснений.
Internal IM Platform: Более быстрый и релевантный поиск документов улучшает совместную работу и повторное использование контента.
Knowledge-Base QA: Точный recall на уровне фрагментов предоставляет ответы, которые поиск по ключевым словам никогда не смог бы выявить.
Повышение справедливости и эффективности образования
Улучшения Milvus превращаются в реальные преимущества в классе. Более быстрое и надежное оценивание с помощью ИИ снижает нагрузку на учителей и обеспечивает более согласованное выставление оценок для больших групп учащихся. Более качественный семантический поиск упрощает нахождение и повторное использование высококачественных учебных ресурсов. Вместе эти улучшения помогают TAL предоставлять более персонализированную и справедливую поддержку каждому ученику.
Более высокая операционная эффективность и наблюдаемость
Для инженерных команд Milvus также упрощает повседневную эксплуатацию. Веб-консоль Attu, официальный инструмент управления Milvus, делает проверку векторов и управление коллекциями более интуитивными, снижая операционные накладные расходы. В то же время интеграции с Prometheus + Alertmanager обеспечивают глубокую видимость задержек, состояния узлов, использования хранилища и паттернов ошибок. Эта наблюдаемость помогает TAL поддерживать стабильные, предсказуемые сервисы — даже во время всплесков трафика и крупных экзаменационных циклов.
Что дальше: развитие вместе с Milvus и сообществом
После прочного внедрения Milvus в нескольких командах TAL теперь смотрит вперед, оценивая, как векторный поиск может поддержать еще больше его ИИ-инициатив. Эксплуатация Milvus на миллиардном масштабе дала инженерам TAL четкое понимание того, что работает хорошо и где новые улучшения могут оказать еще большее влияние.
TAL планирует оставаться активным участником сообщества Milvus — делиться реальным производственным опытом, давать обратную связь по новым функциям и тесно работать с контрибьюторами, формируя следующую волну возможностей векторных баз данных. Улучшения, такие как более простая миграция данных между кластерами и дальнейшая оптимизация производительности, сделали бы внедрение Milvus в большем числе продуктов TAL еще проще.
Чтобы обеспечить бесперебойную работу критически важных сервисов, TAL также использует Zilliz Cloud, полностью управляемый сервис Milvus, наряду со своим open-source-развертыванием Milvus. Такая dual-active конфигурация обеспечивает команде дополнительную надежность во время обновлений или периодов высокого трафика и гарантирует, что учащиеся и учителя всегда имеют стабильный учебный опыт.
По мере того как TAL продолжает создавать более интеллектуальные и масштабируемые инструменты ИИ для образования, Milvus останется ключевой частью его технологического стека, помогая компании предоставлять более быстрые, умные и надежные учебные решения для миллионов семей.
Примечание: Это кейс-стади было написано Zhiming Huang и Muzi Lee, старшими специалистами по данным в TAL Education Group, и переведено, отредактировано и повторно опубликовано здесь с разрешения.
- О TAL Education Group
- Проблемы, с которыми сталкиваются учебные системы TAL на базе ИИ
- Обеспечение работы систем проверки и обучения TAL на базе ИИ с помощью Milvus
- Реальный прирост производительности и новые возможности благодаря Milvus
- Что дальше: развитие вместе с Milvus и сообществом
Контент
Пример использования
Отрасль
Образование


