Entwicklung LLM-erweiterter Apps mit Zilliz Cloud
In den letzten Monaten haben die Veröffentlichung von GPT-3.5 im Nov. 2022 und GPT-4 im März 2023 einen tiefgreifenden Wandel darin ausgelöst, wie Benutzer mit Daten und Anwendungen interagieren. Die transformative Kraft von ChatGPT liegt nicht nur in seiner Fähigkeit, Text zu generieren, sondern in seinem erstaunlichen Verständnis und seiner Anpassungsfähigkeit an den Kontext. Es bietet eine natürlichere und intuitivere Kommunikationsschnittstelle, schafft eine enge Verbindung zwischen Menschen und Maschinen und verwandelt mühsame Aufgaben in mühelose Dialogaustausche. Dieses aufstrebende Feld der Large Language Models (LLMs) hat unsere Erwartungen und Wünsche an Softwareanwendungen verändert und treibt Entwickler in eine Zukunft, in der Anwendungen genutzt und mit ihnen interagiert wird.
Aktuelle Herausforderungen von LLMs in Anwendungen
Trotz ihres Potenzials müssen Entwickler die Herausforderungen bewältigen, die LLMs mit sich bringen, wenn sie LLMs wie ChatGPT in ihren Anwendungen implementieren.
Erstens werden LLMs hauptsächlich mit öffentlich verfügbaren Daten trainiert, sodass ihnen manchmal mehr Nuancen und Kontext von domänenspezifischen, proprietären oder privaten Informationen fehlen. Dieser fehlende Zugang zu privaten Daten beeinträchtigt die Fähigkeit des Modells, Lösungen oder Antworten bereitzustellen, die auf bestimmte spezialisierte Branchen oder Anwendungen zugeschnitten sind.
Die zweite Herausforderung ist als Halluzination bekannt. Dieser Begriff bezieht sich auf die Tendenz von LLMs, Antworten auf Grundlage unvollständiger oder ungenauer Daten zu generieren. Da LLMs ihre Antworten ausschließlich auf die Daten stützen, mit denen sie trainiert wurden, können sie manchmal irreführende, falsche oder vollständig erfundene Antworten erstellen, wenn ihnen mehr Informationen fehlen.
Darüber hinaus können LLMs Schwierigkeiten haben, auf dem neuesten Stand zu bleiben. Trainingsdaten veralten oft schnell, und aufgrund der erheblichen Kosten, die mit dem erneuten Training dieser Modelle verbunden sind — im Bereich von 1,4 Millionen Dollar für Modelle wie GPT-3 — wird ihre Wissensbasis nicht regelmäßig aktualisiert. Diese Einschränkung kann dazu führen, dass sie in ihren Antworten veraltete Informationen liefern.
Aus Leistungsperspektive kann die Nutzung von LLMs für Anwendungen kostspielig und langsam sein. Sie arbeiten mit einem tokenbasierten Abrechnungssystem, bei dem LLMs wie Chat GPT für jedes in einer Anfrage verwendete Token abrechnen. Die Kosten können sich schnell summieren, insbesondere bei großen Mengen an Anfragen oder wiederkehrenden Fragen. Darüber hinaus können während Spitzenzeiten Leistungsprobleme auftreten, was zu frustrierenden Verzögerungen führt. Zusätzlich haben LLMs eine feste Obergrenze für die Anzahl der Tokens in Anfrage-Prompts, was die Komplexität und Länge von Interaktionen einschränkt. Beispielsweise hat ChatGPT-3 ein Limit von 4.096 Tokens, während GPT-4 ein Token-Limit von 8.192 hat.
Schließlich sind die von LLMs verwendeten Vortrainingsdaten unveränderlich. Alle falschen oder veralteten Informationen, die während der Trainingsphase enthalten waren, bleiben bestehen, da es derzeit eine Möglichkeit geben müsste, solche Daten nach dem Training zu ändern, zu korrigieren oder zu entfernen.
Während wir weiter in die Welt der LLM-erweiterten Anwendungen vordringen, ist es entscheidend, diese Herausforderungen anzugehen. Bei der Bewältigung der Herausforderungen kommen innovative Lösungen wie Zilliz Cloud und GPTCache ins Spiel, die wir in den kommenden Abschnitten untersuchen werden.
Erweiterung von LLM-Apps mit Zilliz Cloud und GPTCache
Das volle Potenzial großer LLMs wie ChatGPT in Anwendungen auszuschöpfen, bedeutet, kritische Herausforderungen in Bezug auf Genauigkeit, Aktualität von Informationen, Kosteneffizienz und Leistung zu überwinden, wie oben erläutert. Innovative Lösungen wie Zilliz Cloud und GPTCache bieten robuste Antworten auf diese Probleme.
Verbesserung von Genauigkeit und Aktualität
Zilliz Cloud bietet transformative Lösungen, die die Genauigkeit der von LLMs generierten Antworten erheblich verbessern und ihre Wissensbasis aktuell halten.
Indem Zilliz Cloud Entwicklern und Unternehmen ermöglicht, domänenspezifische, aktuelle und vertrauliche private Daten sicher außerhalb der LLMs zu speichern, stellt es sicher, dass die Antworten genau und relevant sind. Wenn ein Benutzer eine Frage stellt, verwenden LLM-Anwendungen Einbettungsmodelle, um die Frage in Vektoren umzuwandeln. Anschließend führt Zilliz Cloud eine Ähnlichkeitssuche durch, um die für die Anfrage relevanten top-k-Ergebnisse bereitzustellen. Diese Ergebnisse und die ursprüngliche Frage bilden einen umfassenden Kontext, damit das LLM präzisere Antworten generieren kann. Dieser Ansatz mindert das Halluzinationsproblem, bei dem LLMs aufgrund unzureichender oder veralteter Daten falsche oder erfundene Informationen erzeugen könnten.
Wie Zilliz Cloud für Retrieval Augmented Generation funktioniert
Darüber hinaus ermöglicht die Integration von Zilliz Cloud regelmäßige Aktualisierungen der Wissensbasis, wodurch sichergestellt wird, dass die LLMs stets auf die neuesten und genauesten Informationen zugreifen können. Diese Funktion adressiert das Problem, dass LLMs auf veralteten Daten trainiert werden, und bietet Benutzern Antworten, die die neuesten Erkenntnisse widerspiegeln.
Maximierung von Kosteneffizienz und Leistung
Die Kombination von Zilliz Cloud mit GPTCache schafft ein Ökosystem, das die Betriebskosten senkt und die Leistung von LLM-Apps verbessert.
GPTCache ist ein semantischer Open-Source-Cache, der LLM-Antworten speichert. Diese Speicherfunktion ist besonders vorteilhaft für die Verarbeitung wiederkehrender oder ähnlicher Anfragen, da sie unnötige LLM-Aufrufe reduziert, die zu höheren Kosten und langsameren Antworten führen, insbesondere während Spitzenzeiten. Wenn ein Benutzer in diesem Ökosystem eine Frage stellt, überprüft Zilliz Cloud zunächst GPTCache auf bereits vorhandene Antworten. Wenn Zilliz Cloud eine Antwort findet, gibt es diese schnell an den Benutzer zurück. Zilliz Cloud sendet die Anfrage an das LLM für eine Antwort, wenn es keine Ergebnisse findet. Diese Antwort wird dann zur zukünftigen Verwendung in GPTCache gespeichert, wodurch die Ressourcennutzung optimiert wird.
Wie Zilliz Cloud und GPTCache funktionieren
Durch ihr Zusammenspiel bieten Zilliz Cloud und GPTCache eine leistungsstarke Lösung zur Bewältigung der Herausforderungen bei der Implementierung von LLMs in Anwendungen. Diese Synergie schafft eine Umgebung, in der KI-Anwendungen genauere, zeitnahe, kosteneffiziente und leistungsstarke Antworten generieren können, wodurch die Benutzererfahrung und Interaktion erheblich verbessert werden.
Erste Schritte mit dem CVP-Stack zum Erstellen Ihrer LLM-Apps
Nachdem wir die robusten Lösungen untersucht haben, die Zilliz Cloud und GPTCache zur Verbesserung von LLM-Anwendungen bereitstellen, besteht der nächste Schritt darin, zu erkunden, wie diese Tools angewendet werden können und wie Sie mit dem Erstellen Ihrer eigenen Anwendungen beginnen. Eine spannende Entwicklung in der KI-Technologie, der CVP Stack (ChatGPT/LLMs + eine Vektordatenbank + prompt-as-code), bietet ein robustes Framework, um dieses Ziel zu erreichen. Lassen Sie uns dies im folgenden Abschnitt näher betrachten.
Für diejenigen, die in diesem Bereich neu sind, ist OSS Chat ein hervorragendes Beispiel für den leistungsstarken CVP-Stack. OSS Chat ist ein KI-Chatbot, der fundierte Informationen aus Quellen wie GitHub verwendet, um Fragen zu beliebter Open-Source-Software zu beantworten. Unter der Haube ist OSS Chat mit Akcio aufgebaut, einem Open-Source-CVP-Stack für Retrieval Augmented Generation (RAG). Die Informationsabruflogik wird in Ackio ausgedrückt, um GitHub-Repositories und Dokumentationsseiten in Einbettungsvektoren umzuwandeln und die Vektordaten in Zilliz Cloud zu speichern. Wenn ein Benutzer nach einem Open-Source-Projekt fragt, führt Zilliz Cloud eine Ähnlichkeitssuche durch, um die top-k relevantesten Ergebnisse zu finden. Diese Ergebnisse und die ursprüngliche Frage des Benutzers werden zu einem umfassenden Prompt für das LLM neu zusammengesetzt, damit es eine hochwertige Antwort zurückgibt.
Um ein interaktiveres Lernerlebnis zu bieten, laden wir Sie ein, an einem Webinar mit OriginTrail und uns am 7. September teilzunehmen. Diese Sitzung wird tiefer in den Prozess der Entwicklung von LLM-Apps eintauchen und Ihnen ermöglichen, direkt mit erfahrenen Entwicklern und Experten im Bereich der LLM-App-Entwicklung in Kontakt zu treten. Die innovative Kombination aus Zilliz Cloud, GPTCache und LLMs eröffnet Möglichkeiten in der Landschaft der KI-Anwendungsentwicklung. Es gibt keinen besseren Zeitpunkt, diese bahnbrechenden Technologien zu erkunden und Ihre Reise zu beginnen.
Erste Schritte mit Zilliz Cloud
- Kostenlos starten mit dem neuen Starter Plan! Ein großartiger Plan für den Einstieg ohne Installationsaufwand und ohne erforderliche Kreditkarte!
- Oder starten Sie Ihre 30-tägige kostenlose Testversion des Standard-Plans mit Guthaben im Wert von $100 bei der Registrierung und der Möglichkeit, insgesamt Guthaben im Wert von bis zu $200 zu verdienen.
- Tauchen Sie tiefer in die Zilliz Cloud-Dokumentation ein.
- Sehen Sie sich den Leitfaden zur Migration von Milvus zu Zilliz Cloud an.
Weiterlesen

Zilliz Cloud Just Landed in Claude Code
The Zilliz Cloud Plugin brings the full power of Zilliz Cloud directly into your Claude Code terminal as natural-language conversations.

Context Engineering Strategies for AI Agents: A Developer’s Guide
Learn practical context engineering strategies for AI agents. Explore frameworks, tools, and techniques to improve reliability, efficiency, and cost.

Zilliz Cloud BYOC Upgrades: Bring Enterprise-Grade Security, Networking Isolation, and More
Discover how Zilliz Cloud BYOC brings enterprise-grade security, networking isolation, and infrastructure automation to vector database deployments in AWS


