Come TAL Education Group scala l’apprendimento basato sull’IA con Milvus

Ricerca semantica in millisecondi
Recupero istantaneo tra miliardi di vettori, sostituendo il lento fuzzy matching
Maggiore accuratezza nella valutazione
Comprensione semantica più precisa per risposte degli studenti aperte e multimodali
Qualità della raccomandazione più elevata
La ricerca vettoriale ad alto richiamo porta alla luce contenuti rilevanti che la ricerca per parole chiave non rileva
Accelerazioni end-to-end
Pipeline di valutazione, recupero e raccomandazione più rapide con latenza complessiva ridotta
Informazioni su TAL Education Group
TAL Education Group (NYSE: TAL) è una delle principali aziende asiatiche di tecnologia educativa, al servizio di milioni di studenti e famiglie. Fondata nel 2003 e quotata alla Borsa di New York nel 2010, TAL è cresciuta dalla sua attività di tutoraggio Xueersi fino a diventare un ampio portafoglio di prodotti per l’apprendimento digitale—including Xueersi.com, Xueersi Smart Devices, MathGPT e altri brand educativi guidati dalla tecnologia—tutti progettati per supportare gli studenti a casa e negli ambienti di classe digitale.
Con l’espansione di TAL nell’apprendimento basato sull’AI—che comprende tutoraggio personalizzato, correzione automatizzata, raccomandazione di contenuti e recupero della conoscenza multimodale—l’azienda aveva bisogno di una nuova infrastruttura dati in grado di supportare questi carichi di lavoro ad alta intensità di calcolo su larga scala. Scegliendo Milvus come fondamento della sua piattaforma di recupero vettoriale, TAL ha ottenuto le prestazioni, la scalabilità e la flessibilità necessarie per alimentare correzioni più rapide, raccomandazioni più accurate e una ricerca semantica più intelligente in tutti i suoi prodotti. Milvus svolge ora un ruolo chiave nel supportare la missione più ampia di TAL: offrire esperienze di apprendimento di alta qualità, potenziate dalla tecnologia, accessibili, efficienti ed efficaci per ogni studente.
Sfide per i sistemi di apprendimento basati sull’AI di TAL
TAL sta implementando l’AI in diversi scenari didattici fondamentali—correzione automatizzata, raccomandazioni di risorse per l’apprendimento e recupero di documenti basato su vettori. Ma con la crescita di questi servizi, l’azienda ha rapidamente raggiunto i limiti dei sistemi di dati tradizionali. L’istruzione online moderna genera enormi volumi di contenuti complessi e multimodali, mentre la correzione basata sull’AI richiede sia un’elevata produttività sia una profonda comprensione delle risposte degli studenti. Queste pressioni hanno fatto emergere problemi strutturali che le infrastrutture legacy semplicemente non potevano affrontare.
1. Crescita esplosiva dei dati multimodali
TAL elabora ogni giorno centinaia di migliaia di nuove domande e risposte in varie materie, livelli scolastici e formati, inclusi immagini, diagrammi e formule scritte a mano. Questo flusso costante di dati spinge i database tradizionali oltre la loro capacità di indicizzare e recuperare i dati in modo efficiente. Con la crescita delle piattaforme di apprendimento digitale di TAL, il backend deve scalare senza interruzioni per supportare esigenze di archiviazione in aumento, recupero vettoriale ad alta produttività e improvvisi picchi di traffico durante esami e periodi di apprendimento di punta, il tutto senza compromettere prestazioni o disponibilità.
2. Inefficienze operative nella pipeline di correzione
La correzione umana non riesce a tenere il passo con la scala dell’apprendimento online moderno. La valutazione di un singolo test può richiedere a un insegnante 15–20 minuti, e le domande soggettive spesso producono punteggi incoerenti tra i correttori. Alla scala di TAL, ciò comporta colli di bottiglia nella correzione e consuma tempo prezioso degli insegnanti che potrebbe essere reindirizzato verso un’istruzione personalizzata.
Inoltre, TAL mantiene una vasta libreria di spiegazioni, soluzioni e materiali didattici, ma queste risorse sono distribuite tra diversi sistemi. Senza un recupero intelligente, risorse di alta qualità rimangono sottoutilizzate, creando divari tra la creazione di contenuti e le reali esigenze degli studenti.
3. Elevati requisiti di accuratezza per il feedback basato sull’AI
La correzione tramite AI deve fare più che abbinare parole chiave: deve comprendere il significato. I sistemi di TAL devono identificare l’equivalenza semantica, interpretare formulazioni diverse e valutare gli studenti in modo equo e coerente. Qualsiasi spiegazione generata deve essere accurata, pedagogicamente valida e adeguata all’età. Per supportare tutto questo, TAL richiede un solido grafo della conoscenza che colleghi ogni domanda ai concetti appropriati e ne mappi le relazioni. I sistemi tradizionali non sono progettati per supportare questo livello di ragionamento semantico su larga scala.
Alimentare i sistemi di correzione e apprendimento AI di TAL con Milvus
Man mano che TAL ampliava i suoi servizi di valutazione e apprendimento basati sull’IA, aveva bisogno di un’infrastruttura vettoriale in grado di supportare enormi carichi di lavoro di embedding con alta accuratezza e reattività in tempo reale. Dopo aver valutato diverse soluzioni, TAL ha scelto Milvus come motore centrale della sua piattaforma di dati vettoriali.
Su Milvus, TAL ha costruito un’architettura modulare che garantisce alta qualità dei dati, integrazione fluida con le applicazioni e miglioramento continuo del sistema.
Pipeline di elaborazione dei dati: dati puliti, coerenti e pronti per i vettori
La pipeline di elaborazione dei dati di TAL costituisce la base dell’intero sistema. Domande, risposte e materiali didattici vengono acquisiti da più fonti, incluse API, caricamenti batch ed estrazione OCR da immagini o scrittura a mano. Una volta acquisiti, tutti i contenuti passano attraverso normalizzazione, estrazione delle caratteristiche e controlli di qualità prima di essere trasformati in embedding vettoriali. Questa pipeline garantisce che tutto ciò che viene archiviato in Milvus sia pulito, coerente e ottimizzato per un recupero semantico di alta qualità.
Database vettoriale Milvus: recupero ad alte prestazioni su scala di miliardi
Al centro dell’architettura di TAL c’è il database vettoriale Milvus, che offre archiviazione vettoriale su scala di miliardi e ricerca semantica ad alte prestazioni. L’architettura distribuita di Milvus e l’indicizzazione Approximate Nearest Neighbor (ANN) consentono a TAL di servire query di similarità in millisecondi, anche su centinaia di milioni fino a miliardi di embedding. La strategia multi-indice di Milvus aiuta TAL a bilanciare velocità e accuratezza, mentre MySQL archivia metadati strutturati come versioning e mappature degli indici. Questo mantiene i dati vettoriali e i dati relazionali strettamente sincronizzati.
Oggi, questa distribuzione Milvus gestisce oltre 1 miliardo di vettori in più di 20 raccolte, con un singolo cluster che gestisce milioni di richieste di recupero al giorno.
Servizi applicativi: trasformare il recupero vettoriale in impatto educativo
Il livello dei servizi applicativi trasforma le capacità di Milvus in un reale impatto educativo.
Valutazione IA: utilizza la similarità semantica per valutare le risposte degli studenti e generare spiegazioni.
Raccomandazioni: trova domande simili adattate al livello di apprendimento e ai progressi di uno studente.
Deduplicazione dei contenuti: rileva contenuti ripetitivi o ridondanti per mantenere la qualità della banca di domande.
Ogni servizio dipende dalla capacità di Milvus di fornire un recupero rapido e accurato su larga scala, assicurando che studenti ed educatori ricevano risultati tempestivi, personalizzati e coerenti.
Framework di valutazione della qualità: un ciclo chiuso per il miglioramento continuo
Per mantenere l’affidabilità su larga scala, TAL ha costruito un framework di valutazione continua della qualità in tutto il sistema. Ogni risultato di valutazione generato dall’IA riceve un punteggio di confidenza basato su similarità semantica, prestazioni storiche e feedback degli insegnanti. Questi segnali alimentano un ciclo di feedback strutturato che identifica anomalie, regola la logica di assegnazione dei punteggi, aggiorna i parametri del modello e migliora nel tempo la qualità del recupero.
Questo meccanismo a ciclo chiuso garantisce che il sistema diventi più accurato man mano che l’utilizzo cresce, invece di degradarsi sotto carichi di lavoro più pesanti.
Miglioramenti reali delle prestazioni e nuove possibilità abilitate da Milvus
Dopo aver distribuito Milvus nei suoi ambienti di cloud ibrido, TAL ha rapidamente osservato importanti miglioramenti nelle prestazioni del sistema e nella qualità delle esperienze di apprendimento basate sull’IA.
Recupero a livello di millisecondi su scala di miliardi
Milvus ora gestisce miliardi di vettori con ricerca semantica a livello di millisecondi, sostituendo i lenti metodi di fuzzy matching che un tempo frenavano la valutazione IA, le raccomandazioni e il recupero dei contenuti. Con Milvus in uso, i risultati arrivano più rapidamente, l’accuratezza aumenta e insegnanti e studenti ottengono risposte più coerenti su tutta la linea.
Maggiore accuratezza e maggiore stabilità
La ricerca per similarità vettoriale di Milvus offre a TAL una comprensione molto più profonda delle risposte degli studenti. Rispetto ai sistemi precedenti, Milvus offre:
Risultati di recupero più accurati, soprattutto per domande aperte e multimodali
Recall di qualità superiore, facendo emergere contenuti rilevanti che la ricerca per parole chiave non riesce a trovare
Prestazioni stabili su scala di miliardi, anche durante i periodi di punta degli esami
Elaborazione end-to-end più rapida, riducendo la latenza per la valutazione e le raccomandazioni
Questi progressi elevano non solo l’efficienza del sistema, ma anche la qualità didattica, consentendo all’AI di comprendere meglio l’intento degli studenti e di rispondere con maggiore rilevanza pedagogica.
Sbloccare nuove capacità AI in tutto l’ecosistema
Oltre ad accelerare i processi esistenti, Milvus ha abilitato una nuova ondata di funzionalità nelle piattaforme di apprendimento di TAL:
Valutazione AI: Una corrispondenza semantica più precisa migliora la coerenza dei punteggi e la qualità delle spiegazioni.
Piattaforma IM interna: Un recupero dei documenti più rapido e pertinente migliora la collaborazione e il riutilizzo dei contenuti.
QA su Knowledge Base: Un recall accurato a livello di chunk fornisce risposte che la ricerca per parole chiave non avrebbe mai potuto far emergere.
Promuovere equità ed efficienza nell’istruzione
I miglioramenti di Milvus si traducono in vantaggi concreti in aula. Una valutazione AI più rapida e affidabile riduce il carico di lavoro degli insegnanti e crea punteggi più coerenti per grandi gruppi di studenti. Un migliore recupero semantico rende le risorse didattiche di alta qualità più facili da trovare e riutilizzare. Insieme, questi miglioramenti aiutano TAL a offrire a ogni studente un supporto più personalizzato ed equo.
Maggiore efficienza operativa e osservabilità
Per i team di ingegneria, Milvus semplifica anche le operazioni quotidiane. La console web Attu, lo strumento di gestione ufficiale di Milvus, rende l’ispezione dei vettori e la gestione delle collection più intuitive, riducendo l’overhead operativo. Allo stesso tempo, le integrazioni con Prometheus + Alertmanager offrono una visibilità approfondita su latenza, stato dei nodi, utilizzo dello storage e pattern di errore. Questa osservabilità aiuta TAL a mantenere servizi stabili e prevedibili, anche durante picchi di traffico e grandi cicli di esami.
Cosa viene dopo: crescere con Milvus e la community
Con Milvus saldamente implementato in diversi team, TAL guarda ora al futuro per capire come la ricerca vettoriale possa supportare ancora più iniziative AI. L’esecuzione di Milvus su scala di miliardi ha dato agli ingegneri di TAL una visione chiara di ciò che funziona bene e di dove nuovi miglioramenti potrebbero avere un impatto ancora maggiore.
TAL prevede di rimanere attiva nella community di Milvus, condividendo insight reali di produzione, fornendo feedback sulle nuove funzionalità e collaborando strettamente con i contributor per plasmare la prossima ondata di capacità dei database vettoriali. Miglioramenti come una migrazione dei dati cross-cluster più semplice e una continua ottimizzazione delle prestazioni renderebbero ancora più facile per TAL introdurre Milvus in più prodotti.
Per mantenere i servizi critici in esecuzione senza problemi, TAL utilizza anche Zilliz Cloud, il servizio Milvus completamente gestito, insieme alla propria implementazione open-source di Milvus. Questa configurazione dual-active offre al team maggiore affidabilità durante gli aggiornamenti o i periodi di traffico intenso e garantisce che studenti e insegnanti abbiano sempre un’esperienza di apprendimento stabile.
Mentre TAL continua a sviluppare strumenti AI più intelligenti e scalabili per l’istruzione, Milvus rimarrà una parte fondamentale del suo stack tecnologico, aiutando l’azienda a offrire soluzioni di apprendimento più rapide, più smart e più affidabili a milioni di famiglie.
Nota: Questo case study è stato scritto da Zhiming Huang e Muzi Lee, senior data scientist presso TAL Education Group, ed è tradotto, modificato e ripubblicato qui con autorizzazione.
- Informazioni su TAL Education Group
- Sfide per i sistemi di apprendimento basati sull’AI di TAL
- Alimentare i sistemi di correzione e apprendimento AI di TAL con Milvus
- Miglioramenti reali delle prestazioni e nuove possibilità abilitate da Milvus
- Cosa viene dopo: crescere con Milvus e la community
Contenuto
Settore
Istruzione


