Latence et QPS de la recherche vectorielle pour un coût mensuel de 1 000 dollars
Jeu de données
1M Dataset
Performance de la diffusion en continu
Ce graphique compare les performances de recherche sur l'ensemble de données Cohere-10M sous une pression d'ingestion constante. Nous mesurons la latence de recherche en série p99 et le QPS maximal simultané à 90 % de la capacité des données, tandis que la charge de travail d'insertion reste active. Ces résultats "en continu" sont ensuite comparés aux performances "statiques" d'une base de données entièrement indexée et optimisée.
Valeurs de tracé
QPS
- statique (entièrement optimisé)
- ingestion constante (500 lignes/s)
- ingestion constante (1000 lignes/s)
ZillizCloud
8cu-perf
Pinecone
p2.x8-1node
OpenSearch
16c128g
QdrantCloud
16c64g
Milvus
16c64g-sq8
ElasticCloud
8c60g
Performance et rappel
Jeu de données
1M Dataset
Valeurs de tracé
Performance du filtrage
Jeu de données
1M Dataset
Valeurs de tracé