Cómo Solvely.ai escala el aprendizaje con IA en todo el mundo con búsqueda vectorial ultrarrápida en Zilliz Cloud

Latencia un 70 % menor
Recuperación vectorial en menos de 100 ms, incluso durante picos de tráfico
Respuestas 4–5× más rápidas
Emparejamiento instantáneo con soluciones revisadas por expertos para una mejor experiencia de aprendizaje
Costos de infraestructura ~60% más bajos
Escalado rentable a cientos de millones de preguntas
Cero tiempo de inactividad
Rendimiento estable y confiable bajo cargas de trabajo globales de alta concurrencia
From a performance standpoint, Zilliz Cloud's retrieval speed far exceeds our existing system. We achieved approximately 70% reduction in retrieval latency, which translates to a 4-5x improvement in overall problem-solving time when we successfully match original questions. Whether measured by speed, cost, or overall value, Zilliz Cloud perfectly met our expectations.
Dr. Nick Yuan
Acerca de Solvely
Solvely.ai es una plataforma de aprendizaje impulsada por IA que presta servicio a casi 10 millones de estudiantes, educadores y profesionales, abarcando K–12, educación superior y aprendizaje permanente. Conocida por su fortaleza en matemáticas, negocios, medicina y ciencias de la vida, así como en materias STEM, Solvely transforma materiales de aprendizaje en explicaciones instantáneas, práctica personalizada y guías de estudio multimodales.
Lo que distingue a Solvely es su enfoque híbrido: los modelos de IA generan soluciones inteligentes mientras las contrastan con una amplia biblioteca de contenido validado por expertos, lo que la convierte en una herramienta confiable para estudiantes que buscan precisión. Pero a medida que ese banco de preguntas creció hasta alcanzar cientos de millones y su base de usuarios continuó escalando rápidamente, ofrecer respuestas rápidas y fiables se convirtió en un gran desafío de ingeniería. Esa presión finalmente llevó al equipo a adoptar la base de datos vectorial Zilliz Cloud como el motor detrás de su recuperación vectorial.
Con Zilliz Cloud, Solvely ahora ofrece respuestas más rápidas, menor latencia y una experiencia de aprendizaje más fluida, ayudando a millones de estudiantes a obtener el apoyo que necesitan, exactamente cuando lo necesitan. A medida que Solvely continúa ampliando su oferta de productos y su alcance global, Zilliz Cloud proporciona una base vectorial escalable y rentable que mantiene la plataforma funcionando al máximo, acercando un paso más a la realidad la visión de Solvely de un aprendizaje accesible y de alta calidad.
Dolores de crecimiento con el sistema heredado
Una de las funcionalidades principales de Solvely depende de emparejar rápidamente los problemas enviados por los estudiantes con una base de datos seleccionada de preguntas y respuestas verificadas y de alta calidad. Este enfoque combina la fiabilidad de un banco de preguntas estructurado con la flexibilidad y las capacidades de razonamiento de los grandes modelos de lenguaje.
Para hacerlo posible, Solvely utilizó búsqueda por similitud vectorial desde el principio. Los sistemas tradicionales basados en palabras clave y plantillas solo podían coincidir con el texto literalmente, dejando pasar preguntas similares formuladas de forma ligeramente diferente o presentadas de distintas maneras. Con la búsqueda vectorial, Solvely podía incrustar una pregunta de matemáticas o ciencias de un estudiante y recuperar problemas conceptualmente similares, respaldando tanto soluciones seleccionadas y precisas como un razonamiento de IA mejorado mediante recuperación basada en ejemplos. Esto requería dos capacidades clave de su infraestructura vectorial: clustering offline a gran escala para agrupar millones de preguntas por concepto, y búsqueda online rápida y fiable para respaldar flujos de trabajo de tareas en tiempo real.
En las primeras etapas, los servicios existentes manejaban bien estas necesidades. Con un conjunto de datos más pequeño y un menor volumen de tráfico, la latencia de las consultas y los costos eran manejables, y la API simple del sistema ayudó al equipo a avanzar rápidamente. Pero la escala trae complejidad. Con cientos de millones de preguntas en su biblioteca y millones de usuarios dependiendo de la plataforma, el rendimiento y el costo comenzaron a alejarse de lo que la plataforma requería. La latencia, que antes era de unos pocos cientos de milisegundos, superaba un segundo durante las horas pico, cuando muchos estudiantes enviaban consultas simultáneamente. Estos retrasos tuvieron un impacto directo en la experiencia del estudiante.
Los costos también se convirtieron en un problema. Mantener un rendimiento aceptable requería actualizar a niveles significativamente más caros, y el modelo de precios del sistema existente hacía que los costos de almacenamiento y búsqueda aumentaran más rápido que el uso real de Solvely. Finalmente, el equipo llegó a un punto en el que el sistema heredado ya no era sostenible. Solvely necesitaba menor latencia, escalado más predecible y una estructura de costos adecuada para una plataforma educativa global en rápido crecimiento. Estas presiones combinadas de rendimiento y costo los impulsaron a evaluar bases de datos vectoriales alternativas más adecuadas para aplicaciones de IA de alto volumen y sensibles al costo.
Por qué Zilliz Cloud
Cuando Solvely comenzó a evaluar bases de datos vectoriales alternativas, Zilliz Cloud se convirtió rápidamente en uno de los principales candidatos. El equipo ya tenía una amplia experiencia con Milvus—la base de datos vectorial de código abierto ampliamente adoptada creada por el equipo de Zilliz—durante sus primeras fases de desarrollo. Esa familiaridad le dio a Solvely confianza tanto en la tecnología como en el ecosistema más amplio mientras consideraban pasar a una solución totalmente gestionada.
Su evaluación se centró en tres criterios prácticos:
Velocidad de recuperación bajo alta concurrencia
Eficiencia de costos a escala
Simplicidad operativa
Para obtener una comparación precisa, Solvely migró una parte representativa de sus datos a Zilliz Cloud y ejecutó pruebas de referencia directamente contra su implementación existente. Los resultados fueron claros:
Zilliz Cloud ofreció velocidades de recuperación 2–3× más rápidas bajo una carga idéntica.
La latencia cayó de más de 1 segundo a menos de 100 ms, incluso durante picos de concurrencia.
Los costos de infraestructura se redujeron en aproximadamente un 60%, gracias a la utilización más eficiente de recursos de Zilliz Cloud y a su modelo de precios favorable.
La simplicidad operativa demostró ser tan importante como el rendimiento bruto. Con su banco de preguntas expandiéndose a cientos de millones, Solvely necesitaba un servicio que escalara sin problemas sin requerir sobrecarga adicional de ingeniería. Zilliz Cloud satisfizo esa necesidad, permitiendo al equipo centrarse en mejorar la experiencia de aprendizaje de los estudiantes en lugar de mantener la infraestructura backend.
“Queríamos algo que pudiera ayudarnos a salir en vivo rápidamente, listo para usar,” dijo el Dr. Nick Yuan, CTO de Solvely.
Más allá de la velocidad y el costo, el conjunto de funciones de Zilliz Cloud ofrecía la flexibilidad que Solvely necesitaba a medida que su plataforma seguía creciendo. La gestión de particiones y clústeres les permitió organizar su enorme base de datos de preguntas por materia y tipo de contenido. El autoescalado—tanto el escalado dinámico basado en la carga en tiempo real como el escalado programado para picos de tráfico predecibles—garantizó un rendimiento constantemente sólido durante las horas pico de tareas.
La solución: Impulsar el sistema de aprendizaje con IA de Solvely con Zilliz Cloud
El sistema de Solvely funciona como una única canalización integral de Generación Aumentada por Recuperación (RAG) optimizada para la resolución de problemas educativos. A alto nivel, la canalización consta de dos fases estrechamente conectadas:
Preparar por adelantado un banco de preguntas grande y de alta calidad
Realizar recuperación semántica de baja latencia en tiempo real cuando los estudiantes envían preguntas.
Zilliz Cloud sirve como la capa de recuperación vectorial en toda la canalización, apoyando tanto la indexación offline a gran escala como la búsqueda online de alta concurrencia.
Preparación del banco de preguntas
Antes de atender cualquier consulta en vivo, Solvely procesa y organiza cientos de millones de preguntas de múltiples fuentes, incluidas fotos de tareas subidas por estudiantes y conjuntos de datos seleccionados por expertos. Debido a que estas entradas varían ampliamente en estructura y calidad, deben normalizarse y enriquecerse antes de poder buscarse de manera fiable a escala.
Ingesta de contenido: Las imágenes de tareas y las preguntas redactadas manualmente se introducen en el sistema en diferentes formatos. Solvely limpia, deduplica y estandariza este contenido para que pueda procesarse de manera uniforme e indexarse consistentemente en Zilliz Cloud.
Normalización consciente de la materia: Cada pregunta se procesa dentro de su dominio académico para preservar la estructura y el significado específicos de la materia, en lugar de aplanarla en texto genérico. Por ejemplo:
Química: las fórmulas moleculares, los símbolos de elementos y las reacciones se mantienen intactos
Geometría: las relaciones espaciales y la información relacionada con diagramas se preservan
Humanidades: el flujo narrativo y el significado contextual se mantienen
Generación de embeddings: Solvely genera embeddings para todo el corpus de preguntas utilizando modelos de Google u OpenAI. Estos vectores se almacenan e indexan en Zilliz Cloud por adelantado, formando la base para la recuperación semántica de baja latencia en el momento de la consulta.
Integración directa con Zilliz Cloud: Los vectores y metadatos generados se escriben directamente en Zilliz Cloud. Al mantener el pipeline ligero y evitar herramientas de orquestación complejas, Solvely mantiene un mejor control del rendimiento y puede ajustar el sistema para distintas materias.
Recuperación en tiempo real durante los flujos de trabajo de los estudiantes
Cuando un estudiante envía una pregunta de tarea, la misma infraestructura preparada se activa en tiempo real. Este flujo de trabajo online debe ser rápido, fiable y capaz de gestionar entradas académicas complejas con alta concurrencia.
Preprocesamiento de la pregunta:
Si la pregunta se envía como imagen, el OCR primero extrae el texto. Luego, el sistema identifica fórmulas, símbolos e indicios relacionados con diagramas y convierte la entrada en una representación limpia y estandarizada adecuada para embeddings.
Búsqueda vectorial con Zilliz Cloud:
La pregunta procesada se convierte en un vector de más de 1000 dimensiones utilizando modelos de embedding de Google u OpenAI y se envía a Zilliz Cloud para la recuperación por similitud. Este proceso permite al sistema buscar por significado en lugar de por coincidencia exacta de palabras.
A continuación, Solvely realiza dos tipos de recuperaciones complementarias:
Búsqueda de conocimiento de fondo: Incorpora información de fondo específica de la materia, como constantes químicas, identidades matemáticas o material de referencia relevante. Esta contextualización ayuda al LLM a razonar con mayor precisión y reduce las respuestas sin respaldo o alucinadas.
Búsqueda de preguntas similares:: Encuentra preguntas previamente resueltas y revisadas por humanos en la base de datos de Solvely. Estos candidatos son rerankeados por un LLM para captar similitudes sutiles que la búsqueda vectorial por sí sola podría pasar por alto, garantizando que se utilicen los ejemplos más relevantes.
Uso del contenido recuperado según la materia:
Solvely aplica reglas diferentes según la materia. Para matemáticas y ciencias, los ejemplos recuperados ayudan a la IA a comprender el método de solución sin copiar números ni respuestas exactas. Para humanidades, el material recuperado proporciona antecedentes y contexto para respaldar la explicación y la interpretación, en lugar de dar una respuesta fija.
Reformulación de consultas para una mayor calidad de respuesta:
Finalmente, el sistema puede reformular la pregunta original para captar su intención más amplia; por ejemplo, centrarse en el concepto subyacente en lugar de en la redacción exacta. Esto ayuda a recuperar contexto útil que puede no coincidir directamente con el texto, pero que es esencial para resolver el problema correctamente.
El proceso de migración fue sorprendentemente fluido
Una de las mayores preocupaciones de Solvely sobre el cambio de bases de datos era la migración en sí. Tenían cientos de millones de preguntas almacenadas en el sistema existente: ¿cuánto tiempo llevaría trasladar todos esos datos? ¿Requiere escribir scripts de migración complejos? ¿Habría tiempo de inactividad que afectara a los usuarios?
En la práctica, la migración fue notablemente fluida. Zilliz Cloud proporcionó herramientas de migración integradas que se conectan directamente con su sistema anterior. El proceso fue esencialmente de un solo clic: configurar la conexión, especificar qué migrar y dejar que el pipeline se ejecute. Las herramientas se encargaron del trabajo pesado de la transferencia de vectores, la gestión de metadatos y la preservación estructural. El equipo no necesitó escribir código personalizado ni orquestar un pipeline de datos complejo.
Resultados e impacto
Después de migrar a Zilliz Cloud, Solvely observó mejoras medibles en múltiples dimensiones:
Latencia un 70% menor: La latencia en la etapa de recuperación disminuyó aproximadamente un 70% en comparación con el despliegue anterior. Durante los picos de tráfico, las consultas que antes tardaban más de un segundo ahora se completan en decenas a unos pocos cientos de milisegundos.
Coste de infraestructura ~60% menor: Los costes mensuales de infraestructura para la búsqueda vectorial se redujeron aproximadamente un 60% inmediatamente después de la migración, al tiempo que se gestionaban volúmenes de consultas equivalentes o mayores.
Mejor precisión de búsqueda: En materias en las que los LLM tradicionalmente tienen dificultades, como química, geometría y cálculo, el enfoque basado en RAG mejoró significativamente la precisión de las soluciones. Dado que el rendimiento del modelo base ya es sólido, esta mejora incremental es significativa.
Cero tiempo de inactividad, alta disponibilidad: Desde la migración, no han experimentado tiempo de inactividad y han tenido problemas mínimos de rendimiento. El sistema gestiona sin problemas condiciones de carga variables. Cuando tienen preguntas o quieren optimizar algo, reciben respuestas rápidas del equipo de soporte dirigido por expertos técnicos que comprenden bien su caso de uso.
Más allá de las mejoras de rendimiento, el equipo de ingeniería de Solvely también vio claros beneficios operativos. La documentación y los ejemplos de Zilliz Cloud facilitaron el inicio, y el equipo de soporte respondió rápidamente cuando surgieron problemas. Funciones como el escalado automático y programado redujeron el trabajo diario de gestión de infraestructura, por lo que el equipo pudo centrarse más en desarrollar el producto.
Lecciones aprendidas
La experiencia de Solvely destaca algunas conclusiones prácticas para los equipos que desarrollan sistemas de recuperación similares impulsados por IA:
Las preguntas similares importan tanto como las coincidencias exactas. El equipo inicialmente esperaba depender en gran medida de coincidencias exactas de preguntas. En la práctica, las preguntas similares con variaciones menores (como valores numéricos modificados) resultaron igualmente valiosas. Proporcionarlas como contexto al LLM mejoró la calidad de las respuestas incluso cuando no existía una coincidencia exacta.
Reescribir consultas ayuda a encontrar resultados más relevantes. En lugar de incrustar la pregunta original del usuario tal cual, reescribirla para que coincidiera mejor con la forma en que los datos se almacenan en la base de datos vectorial dio lugar a mejores resultados de búsqueda.
Reordenar los resultados después de la recuperación mejora la precisión. Usar un LLM para evaluar y clasificar los candidatos recuperados antes de la generación de la respuesta final ayudó a mostrar las coincidencias más relevantes, especialmente para preguntas que involucran elementos visuales como diagramas o fórmulas.
La recuperación basada en texto sigue funcionando bien. Aunque la incrustación multimodal es un área de interés activa, el equipo descubrió que el OCR seguido de la incrustación de texto ofrecía resultados más fiables que los enfoques actuales de incrustación de imágenes para su caso de uso educativo.
Los servicios gestionados aceleran la iteración. Elegir una base de datos vectorial completamente gestionada permitió al equipo centrar el esfuerzo de ingeniería en su producto principal en lugar de en las operaciones de infraestructura.
De cara al futuro, Solvely planea probar la búsqueda híbrida, que combina la búsqueda semántica con la búsqueda por palabras clave, especialmente útil para materiales de cursos donde los términos exactos importan. También están atentos a las mejoras en la incrustación multimodal, que eventualmente podrían permitir la búsqueda directa de imagen a imagen para materias con muchos diagramas.
Conclusión
Cuando Solvely.ai se propuso democratizar la educación mediante la inteligencia artificial en 2023, sabían que la infraestructura técnica sería fundamental para su misión. Lo que no anticiparon fue lo rápido que superarían su solución inicial de base de datos vectorial. A medida que su base de datos de preguntas creció hasta cientos de millones de entradas y su base de usuarios escaló a 10 millones de estudiantes en todo el mundo, la latencia de las consultas se convirtió en un cuello de botella que amenazaba la experiencia de usuario que intentaban perfeccionar.
La migración a Zilliz Cloud transformó su base técnica. La latencia de las consultas se redujo en un 70 %, los costos de infraestructura disminuyeron en un 60 % y, lo más importante, los estudiantes pudieron obtener ayuda con sus tareas de 4 a 5 veces más rápido cuando el sistema coincidía con preguntas de su base de datos seleccionada. Pero más allá de las cifras, Zilliz Cloud le dio a Solvely algo más valioso: la libertad de centrarse en crear productos educativos innovadores en lugar de lidiar con las operaciones de bases de datos.
A medida que Solvely.ai continúa ampliando su oferta de productos y su base de usuarios, Zilliz Cloud proporciona la base de datos vectorial escalable y rentable necesaria para atender a millones de estudiantes en todo el mundo, acercando la visión de la igualdad educativa a la realidad.
The migration was incredibly smooth. Using the built-in tools, we were able to import our data from Pinecone with essentially one click. The technical support has also been excellent — our questions get resolved almost instantly, and the documentation, demos, and examples are thorough and easy to work with.
Technical Team


