Wie Solvely.ai KI-Lernen weltweit mit blitzschneller Vektorsuche auf Zilliz Cloud skaliert

70 % geringere Latenz
Vektorabruf unter 100 ms, selbst bei Spitzenverkehr
4–5× schnellere Antworten
Sofortiges Matching mit von Experten geprüften Lösungen für ein besseres Lernerlebnis
~60% Niedrigere Infrastrukturkosten
Kosteneffiziente Skalierung auf Hunderte Millionen von Fragen
Keine Ausfallzeit
Stabile, zuverlässige Leistung bei globalen Workloads mit hoher Parallelität
From a performance standpoint, Zilliz Cloud's retrieval speed far exceeds our existing system. We achieved approximately 70% reduction in retrieval latency, which translates to a 4-5x improvement in overall problem-solving time when we successfully match original questions. Whether measured by speed, cost, or overall value, Zilliz Cloud perfectly met our expectations.
Dr. Nick Yuan
Über Solvely
Solvely.ai ist eine KI-gestützte Lernplattform, die fast 10 Millionen Schüler, Studierende, Lehrkräfte und Fachkräfte unterstützt—von K–12 über Hochschulbildung bis hin zu lebenslang Lernenden. Bekannt für ihre Stärke in Mathematik, Wirtschaft, Medizin und Biowissenschaften sowie in MINT-Fächern, verwandelt Solvely Lernmaterialien in sofortige Erklärungen, personalisierte Übungen und multimodale Lernleitfäden.
Was Solvely auszeichnet, ist sein hybrider Ansatz: KI-Modelle generieren intelligente Lösungen und gleichen diese gleichzeitig mit einer umfangreichen Bibliothek von durch Experten validierten Inhalten ab, was es zu einem vertrauenswürdigen Tool für Lernende macht, die Genauigkeit suchen. Doch als diese Fragendatenbank auf Hunderte von Millionen anwuchs und die Nutzerbasis weiterhin schnell skalierte, wurde die Bereitstellung schneller, zuverlässiger Antworten zu einer großen technischen Herausforderung. Dieser Druck führte das Team letztlich dazu, die Vektordatenbank Zilliz Cloud als Engine hinter ihrem Vektor-Retrieval einzuführen.
Mit Zilliz Cloud liefert Solvely nun schnellere Antworten, niedrigere Latenz und ein reibungsloseres Lernerlebnis—und hilft Millionen von Lernenden, genau dann die Unterstützung zu erhalten, wenn sie sie brauchen. Während Solvely sein Produktangebot und seine globale Reichweite weiter ausbaut, bietet Zilliz Cloud eine skalierbare, kosteneffiziente Vektorgrundlage, die dafür sorgt, dass die Plattform ihre beste Leistung erbringt und Solvelys Vision von zugänglichem, hochwertigem Lernen der Realität einen Schritt näher bringt.
Wachstumsschmerzen mit dem Altsystem
Eine der Kernfunktionen von Solvely beruht darauf, von Schülern eingereichte Aufgaben schnell mit einer kuratierten Datenbank verifizierter, hochwertiger Fragen und Antworten abzugleichen. Dieser Ansatz kombiniert die Zuverlässigkeit einer strukturierten Fragendatenbank mit der Flexibilität und den Schlussfolgerungsfähigkeiten großer Sprachmodelle.
Um dies zu ermöglichen, nutzte Solvely von Anfang an die Vektorähnlichkeitssuche. Herkömmliche keywordbasierte und vorlagenbasierte Systeme konnten Text nur wörtlich abgleichen und übersahen ähnliche Fragen, die etwas anders formuliert oder auf andere Weise präsentiert wurden. Mit der Vektorsuche konnte Solvely eine Mathematik- oder Naturwissenschaftsfrage eines Schülers einbetten und konzeptionell ähnliche Aufgaben abrufen—und so sowohl genaue, kuratierte Lösungen als auch verbessertes KI-Schlussfolgern durch beispielbasiertes Retrieval unterstützen. Dies erforderte zwei zentrale Fähigkeiten von ihrer Vektorinfrastruktur: groß angelegtes Offline-Clustering, um Millionen von Fragen nach Konzept zu gruppieren, und schnelle, zuverlässige Online-Suche zur Unterstützung von Echtzeit-Hausaufgaben-Workflows.
In den Anfangsphasen deckten bestehende Dienste diese Anforderungen gut ab. Bei einem kleineren Datensatz und geringerem Traffic-Volumen waren Abfragelatenz und Kosten beherrschbar, und die einfache API des Systems half dem Team, schnell voranzukommen. Doch Skalierung bringt Komplexität mit sich. Mit Hunderten von Millionen Fragen in ihrer Bibliothek und Millionen von Nutzern, die sich auf die Plattform verlassen, begannen Leistung und Kosten von dem abzuweichen, was die Plattform benötigte. Die Latenz, die einst bei wenigen Hundert Millisekunden lag, überschritt während Spitzenzeiten eine Sekunde, wenn viele Schüler gleichzeitig Anfragen stellten. Diese Verzögerungen hatten direkte Auswirkungen auf das Lernerlebnis der Schüler.
Auch die Kosten wurden zu einem Problem. Die Aufrechterhaltung akzeptabler Leistung erforderte ein Upgrade auf deutlich teurere Tarife, und das Preismodell des bestehenden Systems ließ Speicher- und Suchkosten schneller steigen als Solvelys tatsächliche Nutzung. Schließlich erreichte das Team einen Punkt, an dem das Altsystem nicht mehr nachhaltig war. Solvely benötigte niedrigere Latenz, besser vorhersehbare Skalierung und eine Kostenstruktur, die für eine schnell wachsende globale Bildungsplattform geeignet ist. Diese kombinierten Leistungs- und Kostendruckpunkte veranlassten sie, alternative Vektordatenbanken zu evaluieren, die besser für volumenstarke, kostensensible KI-Anwendungen geeignet sind.
Warum Zilliz Cloud
Als Solvely begann, alternative Vektordatenbanken zu evaluieren, wurde Zilliz Cloud schnell zu einem der Top-Kandidaten. Das Team verfügte bereits über umfangreiche Erfahrung mit Milvus—der weit verbreiteten Open-Source-Vektordatenbank, die von the Zilliz team entwickelt wurde—während seiner frühen Entwicklungsphasen. Diese Vertrautheit gab Solvely Vertrauen sowohl in die Technologie als auch in das breitere Ökosystem, als das Unternehmen den Wechsel zu einer vollständig verwalteten Lösung in Betracht zog.
Ihre Evaluierung konzentrierte sich auf drei praktische Kriterien:
Abrufgeschwindigkeit bei hoher Parallelität
Kosteneffizienz bei Skalierung
Operative Einfachheit
Um einen genauen Vergleich zu erhalten, migrierte Solvely einen repräsentativen Ausschnitt seiner Daten in Zilliz Cloud und führte Benchmark-Tests direkt im Vergleich zu seiner bestehenden Bereitstellung durch. Die Ergebnisse waren eindeutig:
Zilliz Cloud lieferte bei identischer Last 2–3× schnellere Abrufgeschwindigkeiten.
Die Latenz sank von über 1 Sekunde auf unter 100 ms, selbst während Spitzenlasten bei hoher Parallelität.
Die Infrastrukturkosten sanken um etwa 60 %, dank der effizienteren Ressourcennutzung und des vorteilhaften Preismodells von Zilliz Cloud.
Operative Einfachheit erwies sich als ebenso wichtig wie die reine Leistung. Da ihre Fragendatenbank auf Hunderte von Millionen anwuchs, benötigte Solvely einen Dienst, der reibungslos skaliert, ohne zusätzlichen Engineering-Aufwand zu erfordern. Zilliz Cloud erfüllte diesen Bedarf und ermöglichte es dem Team, sich auf die Verbesserung des Lernerlebnisses der Studierenden zu konzentrieren, anstatt Backend-Infrastruktur zu warten.
„Wir wollten etwas, das uns dabei unterstützen konnte, schnell und out of the box live zu gehen“, sagte Dr. Nick Yuan, CTO bei Solvely.
Über Geschwindigkeit und Kosten hinaus bot der Funktionsumfang von Zilliz Cloud die Flexibilität, die Solvely benötigte, während seine Plattform weiter wuchs. Partitions- und Clusterverwaltung ermöglichten es ihnen, ihre riesige Fragendatenbank nach Fach und Inhaltstyp zu organisieren. Auto-Scaling—sowohl dynamische Skalierung basierend auf Echtzeitlast als auch geplante Skalierung für vorhersehbare Traffic-Spitzen—stellte während der Spitzenzeiten für Hausaufgaben eine konstant starke Leistung sicher.
Die Lösung: Solvelys KI-Lernsystem mit Zilliz Cloud betreiben
Solvelys System arbeitet als eine einzige, durchgängige Retrieval-Augmented-Generation-(RAG)-Pipeline, die für die Lösung von Bildungsaufgaben optimiert ist. Auf hoher Ebene besteht die Pipeline aus zwei eng miteinander verbundenen Phasen:
Eine große, hochwertige Fragendatenbank im Voraus vorbereiten
Semantischen Abruf mit niedriger Latenz in Echtzeit durchführen, wenn Studierende Fragen einreichen.
Zilliz Cloud dient in der gesamten Pipeline als Vektorabrufschicht und unterstützt sowohl groß angelegte Offline-Indexierung als auch Online-Suche bei hoher Parallelität.
Vorbereitung der Fragendatenbank
Bevor Live-Abfragen bedient werden, verarbeitet und organisiert Solvely Hunderte von Millionen von Fragen aus mehreren Quellen, darunter von Studierenden hochgeladene Hausaufgabenfotos und von Experten kuratierte Datensätze. Da diese Eingaben in Struktur und Qualität stark variieren, müssen sie normalisiert und angereichert werden, bevor sie zuverlässig und in großem Maßstab durchsucht werden können.
Content-Ingestion: Hausaufgabenbilder und manuell erstellte Fragen werden in verschiedenen Formaten in das System eingegeben. Solvely bereinigt, dedupliziert und standardisiert diese Inhalte, damit sie einheitlich verarbeitet und konsistent in Zilliz Cloud indexiert werden können.
Fachbezogene Normalisierung: Jede Frage wird innerhalb ihrer akademischen Domäne verarbeitet, um fachspezifische Struktur und Bedeutung zu bewahren, anstatt sie zu generischem Text zu verflachen. Zum Beispiel:
Chemie: Molekülformeln, Elementsymbole und Reaktionen bleiben intakt
Geometrie: Räumliche Beziehungen und diagrammbezogene Informationen bleiben erhalten
Geisteswissenschaften: Erzählfluss und kontextuelle Bedeutung werden beibehalten
Embedding-Generierung: Solvely generiert Embeddings für den gesamten Fragenkorpus mithilfe von Google- oder OpenAI-Modellen. Diese Vektoren werden im Voraus in Zilliz Cloud gespeichert und indexiert und bilden die Grundlage für semantischen Abruf mit niedriger Latenz zum Abfragezeitpunkt.
Direkte Integration mit Zilliz Cloud: Die generierten Vektoren und Metadaten werden direkt in Zilliz Cloud geschrieben. Indem die Pipeline schlank gehalten und komplexe Orchestrierungstools vermieden werden, behält Solvely eine bessere Kontrolle über die Performance und kann das System für verschiedene Fächer feinabstimmen.
Echtzeit-Abruf während studentischer Workflows
Wenn ein Schüler eine Hausaufgabenfrage einreicht, wird dieselbe vorbereitete Infrastruktur in Echtzeit aktiviert. Dieser Online-Workflow muss schnell und zuverlässig sein und komplexe akademische Eingaben bei hoher Gleichzeitigkeit verarbeiten können.
Vorverarbeitung der Frage:
Wenn die Frage als Bild eingereicht wird, extrahiert OCR zunächst den Text. Anschließend erkennt das System Formeln, Symbole und diagrammbezogene Hinweise und wandelt die Eingabe in eine saubere, standardisierte Darstellung um, die für Embeddings geeignet ist.
Vektorsuche mit Zilliz Cloud:
Die verarbeitete Frage wird mithilfe von Embedding-Modellen von Google oder OpenAI in einen über 1000-dimensionalen Vektor umgewandelt und zur Ähnlichkeitsabfrage an Zilliz Cloud gesendet. Dieser Prozess ermöglicht es dem System, nach Bedeutung statt nach exakter Formulierung zu suchen.
Solvely führt anschließend zwei Arten komplementärer Abrufe durch:
Suche nach Hintergrundwissen: Ruft fachspezifische Hintergrundinformationen ab, etwa chemische Konstanten, mathematische Identitäten oder relevantes Referenzmaterial. Diese Verankerung hilft dem LLM, präziser zu schlussfolgern, und reduziert unbelegte oder halluzinierte Antworten.
Suche nach ähnlichen Fragen:: Findet zuvor gelöste, von Menschen geprüfte Fragen aus Solvelys Datenbank. Diese Kandidaten werden von einem LLM neu gerankt, um subtile Ähnlichkeiten zu erfassen, die die Vektorsuche allein möglicherweise übersieht, sodass die relevantesten Beispiele verwendet werden.
Fachbewusste Nutzung abgerufener Inhalte:
Solvely wendet je nach Fach unterschiedliche Regeln an. In Mathematik und Naturwissenschaften helfen abgerufene Beispiele der KI, die Lösungsmethode zu verstehen, ohne exakte Zahlen oder Antworten zu kopieren. In den Geisteswissenschaften liefert abgerufenes Material Hintergrund und Kontext, um Erklärung und Interpretation zu unterstützen, statt eine feste Antwort zu geben.
Neuformulierung der Abfrage für höhere Antwortqualität:
Schließlich kann das System die ursprüngliche Frage umformulieren, um ihre umfassendere Absicht zu erfassen – zum Beispiel, indem es sich auf das zugrunde liegende Konzept statt auf die exakte Formulierung konzentriert. Dies hilft dabei, nützlichen Kontext abzurufen, der möglicherweise keine direkte Textübereinstimmung ist, aber entscheidend dafür ist, das Problem korrekt zu lösen.
Der Migrationsprozess verlief überraschend reibungslos
Eine der größten Sorgen von Solvely beim Wechsel der Datenbanken war die Migration selbst. Sie hatten Hunderte Millionen von Fragen im bestehenden System gespeichert – wie lange würde es dauern, all diese Daten zu verschieben? Erfordert es das Schreiben komplexer Migrationsskripte? Würde es Ausfallzeiten geben, die Nutzer beeinträchtigen?
In der Praxis verlief die Migration bemerkenswert reibungslos. Zilliz Cloud stellte integrierte Migrationstools bereit, die sich direkt mit ihrem vorherigen System verbinden. Der Prozess war im Wesentlichen ein Ein-Klick-Vorgang – Verbindung konfigurieren, festlegen, was migriert werden soll, und die Pipeline laufen lassen. Die Tools übernahmen die schwere Arbeit der Vektorübertragung, Metadatenverwaltung und Strukturerhaltung. Das Team musste keinen benutzerdefinierten Code schreiben oder eine komplexe Datenpipeline orchestrieren.
Ergebnisse & Auswirkungen
Nach der Migration zu Zilliz Cloud beobachtete Solvely messbare Verbesserungen in mehreren Dimensionen:
70% geringere Latenz: Die Latenz in der Abrufphase sank im Vergleich zur vorherigen Bereitstellung um etwa 70%. Während Spitzenlastzeiten werden Abfragen, die zuvor über eine Sekunde dauerten, nun in Dutzenden bis niedrigen Hunderten von Millisekunden abgeschlossen.
~60% geringere Infrastrukturkosten: Die monatlichen Infrastrukturkosten für die Vektorsuche sanken unmittelbar nach der Migration um rund 60%, während gleichwertige oder höhere Abfragevolumina verarbeitet wurden.
Bessere Suchgenauigkeit: Bei Fächern, in denen LLMs traditionell Schwierigkeiten haben, wie Chemie, Geometrie und Analysis, verbesserte der RAG-basierte Ansatz die Genauigkeit der Lösungen deutlich. Angesichts der bereits starken Leistung des Basismodells ist dieser inkrementelle Zugewinn erheblich.
Keine Ausfallzeiten, hohe Verfügbarkeit: Seit der Migration gab es keinerlei Ausfallzeiten und nur minimale Leistungsprobleme. Das System bewältigt unterschiedliche Lastbedingungen reibungslos. Wenn Fragen auftreten oder sie etwas optimieren möchten, erhalten sie schnelle Antworten vom Support-Team, das von technischen Experten geleitet wird, die ihren Anwendungsfall gut verstehen.
Neben Leistungsverbesserungen stellte Solvelys Engineering-Team auch klare betriebliche Vorteile fest. Die Dokumentation und Beispiele von Zilliz Cloud erleichterten den Einstieg, und das Support-Team reagierte schnell, wenn Probleme auftraten. Funktionen wie automatische und geplante Skalierung reduzierten den täglichen Aufwand für die Verwaltung der Infrastruktur, sodass sich das Team stärker auf die Entwicklung des Produkts konzentrieren konnte.
Lessons Learned
Solvelys Erfahrung verdeutlicht einige praktische Erkenntnisse für Teams, die ähnliche KI-gestützte Retrieval-Systeme entwickeln:
Ähnliche Fragen sind genauso wichtig wie exakte Übereinstimmungen. Das Team erwartete zunächst, sich stark auf exakte Frageübereinstimmungen zu stützen. In der Praxis erwiesen sich ähnliche Fragen mit geringfügigen Abweichungen (z. B. geänderten Zahlenwerten) als ebenso wertvoll. Diese dem LLM als Kontext bereitzustellen, verbesserte die Antwortqualität selbst dann, wenn keine exakte Übereinstimmung vorhanden war.
Das Umschreiben von Abfragen hilft, relevantere Ergebnisse zu finden. Anstatt die ursprüngliche Frage des Nutzers unverändert einzubetten, führte das Umschreiben der Frage, damit sie besser dazu passt, wie Daten in der Vektordatenbank gespeichert sind, zu besseren Suchergebnissen.
Das erneute Ranking der Ergebnisse nach dem Retrieval verbessert die Genauigkeit. Der Einsatz eines LLM, um abgerufene Kandidaten vor der finalen Antwortgenerierung zu bewerten und zu ordnen, half dabei, die relevantesten Treffer hervorzuheben, insbesondere bei Fragen mit visuellen Elementen wie Diagrammen oder Formeln.
Textbasiertes Retrieval funktioniert weiterhin gut. Während multimodales Embedding ein aktives Interessengebiet ist, stellte das Team fest, dass OCR gefolgt von Text-Embedding für ihren Bildungsanwendungsfall zuverlässigere Ergebnisse lieferte als aktuelle Image-Embedding-Ansätze.
Managed Services beschleunigen Iterationen. Die Wahl einer vollständig verwalteten Vektordatenbank ermöglichte es dem Team, seine Engineering-Ressourcen auf das Kernprodukt statt auf den Infrastrukturbetrieb zu konzentrieren.
Mit Blick auf die Zukunft plant Solvely, hybride Suche zu testen, die semantische Suche mit Keyword-Suche kombiniert – besonders hilfreich für Kursmaterialien, bei denen exakte Begriffe wichtig sind. Außerdem behalten sie Verbesserungen beim multimodalen Embedding im Blick, die möglicherweise irgendwann eine direkte Bild-zu-Bild-Suche für Fächer mit vielen Diagrammen ermöglichen.
Fazit
Als Solvely.ai 2023 antrat, Bildung durch künstliche Intelligenz zu demokratisieren, wussten sie, dass die technische Infrastruktur für ihre Mission entscheidend sein würde. Was sie nicht erwartet hatten, war, wie schnell sie aus ihrer anfänglichen Vektordatenbanklösung herauswachsen würden. Als ihre Fragendatenbank auf Hunderte Millionen Einträge anwuchs und ihre Nutzerbasis auf 10 Millionen Schüler und Studierende weltweit skalierte, wurde die Abfragelatenz zu einem Engpass, der genau die Nutzererfahrung bedrohte, die sie perfektionieren wollten.
Die Migration zu Zilliz Cloud verwandelte ihre technische Grundlage. Die Abfragelatenz sank um 70 %, die Infrastrukturkosten fielen um 60 %, und vor allem konnten Schüler und Studierende 4- bis 5-mal schneller Hilfe bei ihren Hausaufgaben erhalten, wenn das System Fragen aus ihrer kuratierten Datenbank zuordnete. Doch über die Zahlen hinaus gab Zilliz Cloud Solvely etwas noch Wertvolleres: die Freiheit, sich auf den Aufbau innovativer Bildungsprodukte zu konzentrieren, statt sich mit dem Datenbankbetrieb herumzuschlagen.
Da Solvely.ai sein Produktangebot und seine Nutzerbasis weiter ausbaut, bietet Zilliz Cloud die skalierbare, kosteneffiziente Vektordatenbank-Grundlage, die benötigt wird, um Millionen von Studierenden weltweit zu unterstützen und die Vision der Bildungsgleichheit der Realität näherzubringen.
The migration was incredibly smooth. Using the built-in tools, we were able to import our data from Pinecone with essentially one click. The technical support has also been excellent — our questions get resolved almost instantly, and the documentation, demos, and examples are thorough and easy to work with.
Technical Team


