Events
OriginTrailとMilvusでハルシネーションのないセマンティック検索アプリケーションを構築する

OriginTrailとMilvusでハルシネーションのないセマンティック検索アプリケーションを構築する

Name: OriginTrailとMilvusでハルシネーションのないセマンティック検索アプリケーションを構築する
Start: 2023-09-08T00:00:00.000Z
End: 2023-09-08T01:00:00.000Z

Zilliz ウェビナー - Zoom

セッションについて

LLMのトレーニングにおいて最も重要なことの一つは、データと情報の信頼性を確保することです。OriginTrailは、この課題に対処するため、Milvus上のセマンティック検索を備えた分散型ナレッジグラフを構築しています。本ウェビナーでは、これらのテクノロジーをどのように活用して、より信頼性の高いAIシステムを開発できるかを紹介します。

MilvusベクトルデータベースとOriginTrail 分散型ナレッジグラフを基盤とする、Trusted Knowledge Assetsと抽出型質問応答の活用に焦点を当てます。

学べること:

OriginTrailを使用して、信頼できるKnowledge Assetsを作成し、所有する方法。
Milvusを使用してKnowledge Assetsのセマンティック検索を可能にする手法。
独自の信頼性の高いナレッジアプリケーションを作成したい開発者向けのツールとソフトウェア開発キット（SDK）の概要。

View presentation slides

Transcript

おはようございます、こんにちは、そしてこんばんは、皆さん。本日のセッション、Origin Trail とnovis で構築するハルシネーションのないセマンティック検索アプリケーションにご参加いただき、誠にありがとうございます。私は Yu Eugene Tang で、ここ Zillow のチームの一員です。いくつか事務連絡事項をお伝えしてから、すぐに本セッションに入りたいと思います。まず。

このウェビナーは録画されていますので、途中で退出しなければならない場合でも、数日以内にオンデマンド版にアクセスできるようになります。ご質問がある場合は、画面下部の Q&A ツールに自由に貼り付けてください。また今後のイベントとして、9月21日に私が担当するものがあり、引用と出典表示を、ええと、検索拡張生成で行うことについてお話しします。そして28日には、ええと、Cradle AI の共同創業者兼 C t O にお越しいただき、VIS の実践について発表していただきます。事務連絡は以上です。

ええと、本日は本日のセッション、Origin Trail と vis で構築するハルシネーションのないセマンティック検索アプリケーションと、ゲストスピーカーの Emir Raic をご紹介できることを嬉しく思います。Emir は、Origin Trail のコア開発者である Trace Labs の創業者兼 c t O です。Brand me は、AI グレードのナレッジアセットをウェブ全体で発見可能かつ検証可能にするために設計された Origin Trail の分散型 Knowledge Graph、D K G のアーキテクトであり作成者です。Meir はキャリアを通じて、分散型ネットワークにわたるネットワーキングの課題に特に注力してきました。ええと、D K G のほかにも、Ethereum や Polka dot、ええと、セマンティックネットワーク、さらにはモバイルネットワークにも取り組んできました。オープンソースおよびパーミッションレスシステムの強力な支持者として、Brand mirrors は標準化開発、GS one 内のワーキンググループ、さまざまなブロックチェーンコミュニティで積極的に活動しています。Serbian Entrepreneurs Collective のメンバーであり、H PharmAccelerator の卒業生でもあります。ようこそ、brand, Amir。

どうもありがとう、Jim。ええと、皆さんこんにちは。世界のどこにいらっしゃるかに応じて、おはようございます、こんにちは、またはこんばんは。ええと、そうですね、ここに来て、Origin Trail 内で、ええと、vis とも連携して最近取り組んでいることを発表できて本当に嬉しいです。ですので、ええと、このプレゼンテーションが皆さんにとって興味深いものになることを願っています。

おそらく、Zillow のウェビナーで通常見られるものとは少し違うと思います。なぜなら、信頼された、ええと、ブロックチェーンと launch graph の観点があるからです。ですので、それがどのように機能するのかを少し深掘りしますが、ええと、あまり複雑にならないように高いレベルに留めるつもりです。ええと、ただ、質問があれば、自由に q and a に投稿してください。最後に Eugene と一緒に、ええ、答えられるようにしたいと思います。ええと、では、もうほぼ始められると思います。ええと、ここでの焦点ですね。Origin Trail と bu による、ハルシネーションのないセマンティック検索アプリについてお話しします。

そして、ええと、実際にここでの大まかな問題と、なぜ、なぜ私たちがそもそも、ええと、この領域にいるのかを紹介するところから始めます。そして、ええと、この、ええ、通話に参加しているほとんど全員が知っているはずの人物を取り上げます。ええ、AIのゴッドファーザーと呼ばれているJeffrey Hintonです。彼は最近、Googleを辞めました。最近、半年ほど前かそのくらいですが、ええ、今後の危険のためです。ええ、皆さんご存じのとおり、ええ、最近起きた大規模言語モデルのモデル全体のブームがあります。そして、ええ、彼は基本的にこのアイデアを先導していた人物の一人として認められています。ええ、そして今では、彼が何が起こり得るのかについて非常に心配しているように見えます。ええ、そして非常に大きな問題は、ええ、ここで言うと、ええと、まあ、明らかにLMSにはこの奇妙な幻覚という概念、あるいは本当にただ何かを推測するようなものがあり、ええ、必ずしもまったく正しいとは限らない、あるいは、ええ、何らかの形で検証可能とは限らない出力を出してしまう、放ってしまうということです。そして、ええ、それはすでに世界で起きています。つまり私たちは、この種のポスト、ポスト真実の世界に生きているわけですよね？そこでは多くの、ええ、人々が一般的に、ほら、ええ、物事に、ええ、フェイクニュースだとか、そして、こうした新しい新しいラベルを、私たちが、ええ、何年も前にはあまり聞かなかったような物事に貼っています。

そして今、AIによって、ほら、幻覚を起こすことができ、世界中のコンテンツ作成のより大きな部分になりつつあります。ええ、問題はただ大きくなるだけです。そして、ええ、例えば、ある弁護士の事例がありました。ええ、その人はChad g p tで法的調査をしました。おそらく悪意があったわけではなく、むしろそうである可能性が高いです。ええ、その人は急いでいたのです。今日、私たちは皆急いでいますよね？だから、ええ、その結果、その申し立ての中で、事件である限り、ええ、存在しないいくつかの、ええ、提出書類を引用することになりました。

そのため、結局、その、裁判所との間で本人がトラブルに巻き込まれることになりました。ええ、なぜならChad g p tが、どこにもつながらない、存在しない、ええ、これらの引用を大量に作り出したからです。ええ、つまり、これは、これが起きていることの実際に具体的な例の一つにすぎません。ええ、しかし起きているだけでなく、それはまた、ええ、AIの導入、とりわけ企業内での導入にとって大きな障害でもあります。そしてそれは私たちの企業パートナーから聞いていることです。ええ、実際に彼らのかなり多くが、LMSのような技術を使うことに関心を持っていると聞きました。ええ、しかし一方で、ほら、まあ、それは何でも吐き出せてしまう、というこの概念によってかなり、ええ、妨げられているのです。

ですから、ええ、エンタープライズグレードの観点からは、ええ、これはまだ、ええ、本当に取り組みやすいものではありません。ですから、ええ、この、この問題提起全体は、今ではかなり、かなり理解しやすいものになっていると思いますが、皆さんにとって、そして、ええ、本質的に私たちは、この誤情報の氾濫こそが、信頼できるデータが本当に全人類にとっての礎となる場所だと見ていますが、特にセキュリティ、ええ、あるいは本当にさらなる繁栄のためのシステムにとってそうです。ええ、つまり、何らかの混沌へと分岐していくのではなく、より信頼できる信頼性の高いシステムへと収束することです。ええ、そしてそのため、Origin 12では、私たちは実際に、今まさに別の知識革命が起きていると考えています。これまでに3つ見てきました。最初のものは印刷機によって始動しました。

私たちには知識の不足という問題があり、知識は基本的にヨーロッパでは、主に、ほら、教会や世界中の希少な図書館のような存在の内部でうまく管理されていました。そして、ええ、それは、少数の場所に非常に集中していました。ええ、その後、印刷機が登場し、突然、複製が不足への解決策として現れ、そしてほら、世界は変わります。そして、文字どおりルネサンスが起こり、世界は、ええ、まったく異なり、より進歩したものになります。そして次に当然、私たちには、その、大きな革命があります。それは、ええ、インターネットによって起こったもので、周囲に存在していた知識の断片化を解決しました。接続性を解決策として、私たちは、ネットワークを手に入れ、ワールドワイドウェブを手に入れました。

ええと、それから今日説明したように、私たちにはウェブ2とウェブ3があり、その概念を、あの、次のレベルへと発展させました。そこでは、私たちは基本的にこの、この2つ目の問題、断片化の問題を解決し、そして、ええと、過去数十年の間に驚くべき知識革命が起きました。そして今、私たちは新たな革命の真っただ中にいます。ええと、そしてこの新しい、新たな革命は、明らかにAIによって推進されているのですが、それがすぐに、誰もの目の前に突きつける問題があります。それがこの信頼の問題です。私たちは、あの、自分たちが見ている情報をどのように信頼するのか、そして、ええと、私たちが得ているもの、私たちが、私たちが、あの、何らかの形で、ええと、到達し、発見したものが、実際に信頼できるものであると、どのように検証できるのか。そして、ええと、私たちは、あの、この問題の解決策は本当に分散型AIであると考えています。

ええと、Origin Trailでは、私たちは、あの、分散型ネットワークに基づく技術を、あの、約7年間構築してきました。実際にはそれよりずっと前から始めていて、中央集権型のプロプライエタリシステムを構築していました。そして2017年頃に、あの、私たちは、ええと、私たちは、私たちが本当に、あの、この技術をできるだけ多くの人々に公開すべきだと気づきました。そこで私たちは、中央集権型のプロプライエタリから、分散型かつオープンソースへと移行しました。ですので今日は、Origin Trailについてもう少し説明しますが、ええと、この、物事のより大きな枠組みの文脈において、今日私たちがいる知識革命は、本質的には、あの、分散型技術が、ええと、爆発的に広がる素晴らしいAIの世界を、あの、その下にある一種の信頼できるインフラとして支える形で融合していくことになると、私たちは考えています。

つまり本質的に、Origin Trailでは、知識は新しい資産クラスである、と私たちはよく言います。ええと、したがって、あの、Origin Trailはそれを掌握できるようにする技術を構築しています。ええと、今日は、ええと、Origin Trailの背後にある概念と、それが、あの、特にVUSとどのように結びつくのか、あわせて、あの、AIともどのように結びつくのかを説明します。そして、これがどのように機能するのかを示すために、小さなデモアプリケーションをお見せします。ええと、実際にはいくつかの異なるケースで示します。あの、しかしその前に、私は、Origin Trailについて少し導入をしなければなりません。そうすれば、私が信頼できるAIインフラと言うときに何を意味しているのか、実際に理解できるようになります。ええと、念のためですが、Origin Trailは何か、ええと、いわゆる実験室の技術ではありません。

あの、実際には世界中の企業によって長年にわたり多く利用されてきました。ええと、いくつかの例がこちらの画面に表示されていますが、それらについてあまり深くは掘り下げません。ご興味があれば、私たちのウェブサイトでさらに多くの情報をご覧いただけますが、ひとつ強調しておきたいのはTrusted Factoryのケースです。そこでは、あの、British Standards Institutionが、あの、Walmart、Target、Home Depotといった米国最大級の小売業者とともに、世界中の工場のセキュリティ監査を共有するためのシステムをOrigin Trail上に構築し、実際に米国輸入の40%をカバーしています。つまり、これらすべてがOrigin Trail、分散型の大規模グラフの上に構築されています。ええと、鉄道旅行の安全性も別のケースで、私たちは、あの、Swiss Railway companyと長年にわたり協力しています。私たちは基本的に、欧州全域の列車を含め、同社の鉄道サプライチェーン内のあらゆるものを追跡しており、実際に、その、その、安全上のリスクを最小化しています。

ええと、おそらく、もし、もしあなたが米国にいるなら、あるいは、私の出身地であるセルビアでは、ここ1、2年で本当に壊滅的な鉄道事故がいくつかあり、環境にも人々にも大きな被害をもたらしました。ですから、ええと、こうした種類のケースこそ、信頼できる知識共有が本当に役立つ場面です。なぜなら、ええと、ある意味でこの、ええと、昔ながらの業界にとって、これらすべての情報を集約し、さらに信頼できる形でアクセスすることは、実際に大きな問題だからです。食品・飲料のトレーサビリティも、私たちの場合、今日その点について何かお見せしますが、基本的に私たちはこの業界で非常に積極的に活動してきました。ええと、ウイスキーから、生鮮品や乳製品に至るまで追跡しており、ええと、数年前からは医薬品分野でも同様です。ですから、ええと、Origin Trail の上に構築されたシステムは、ワクチンや医薬品を米国からインドまでずっと追跡するために使われてきました。そして実際に、ええと、それらが何らかの闇市場に流れるのではなく、本当に患者のもとに届くようにしています。彼らはそれを diversion と呼びたがりますが、私は、私はそれを単純化して盗みだと言いたいです。

つまり、この技術はそれが起こらないようにするのに役立ちます。そしてこれらはその事例の一部にすぎず、他のアプリケーションもあります。先ほど言ったように、ウェブサイト、ええと、origin Trail io で確認できます。では、ええと、それがどのように機能するのか説明してみます。実際、Origin Trail の中核は、ナレッジアセットと呼ばれるものです。

ええと、先ほど言ったように、知識は新しい資産クラスですよね？ですので、これらの、これらのナレッジアセットがどのように機能するのかを、高いレベルで説明してみます。それらは何なのか、何ができるのか。では、いくつかのスライドで説明してみますし、実際にナレッジアセットがどのようなものかを非常に実践的にお見せします。ナレッジアセットとは知識のためのコンテナであり、基本的には、ええと、検証可能な、ええと、知識の箱のようなものです。そして、それらでできることは、それらを作成し、所有することです。つまり基本的に、ええと、もし私が今ナレッジアセットを作成するとしたら、企業の知識や個人的な知識、たとえばスマートウォッチなどのデバイスからの知識を取り、それをナレッジ、ええと、ナレッジグラフの形で構造化できます。その仕組みはすぐにお見せします。そして Origin Trail の分散型ナレッジグラフ上にこのナレッジアセットを作成します。それを行うと、ええと、実際に N F T が作成され、この N F T はこのナレッジアセットを表すために存在します。

つまりある意味で、それはこのナレッジアセットのコンテナであり、ええと、つまり、ええと、私がこの知識の所有者であることを示すと同時に、この知識を変更できるようにしてくれます。つまり、この N F T を持っている人だけが、時間の経過とともに、ええと、このナレッジアセットを更新できるのです。そしてこの、ええと、短いアニメーションでは、実際に、ええと、ええと、E RRC seven one NFT が付与されたナレッジアセットが作成されているのを見ることができます。これは猿の写真の N F T ではありません。NFT の目的は、かっこよく見せることや、何らかのコミュニティの一員になることではなく、むしろ技術的なコンポーネントであり、このナレッジアセットの管理のために文字どおり使われます。

つまり、ええと、それは、それは、ほら、普通なら、ええと、何というか、それのシャツを着て走り回っている人を見かけるようなものではありません、ええと、しかし、このN F Tをあらゆる種類の知識マーケットプレイス、N F Tマーケットプレイスに公開することはできるかもしれません。そこでは文字どおり、非常にリッチな知識資産を作成し、その後すぐに、これらの標準やウォレット、そしてそれを可能にするすべてのもののおかげで、このブロックチェーン、ええと、Web3インフラのすべてを活用できます。ええと、いったん、ええと、自分の知識資産を作成し、そして所有すると、ええと、それは、それは分散型モダングラフの中で発見可能になり、基本的にはこの、ええと、ユニークな資産、ええと、ロケーター、ええと、U R L、Uniform Research Locatorの後継となるものを取得します。ええと、それによって、この、ええと、知識資産を実際に読み込むことが可能になります。このアニメーションがそれを簡単に示しています。後でもう一度お見せしますが、要するに、u lを持っている人なら誰でもこの知識資産にアクセスでき、そのすべての内容を見ることができます。そして実際、すべての内容を見ることに加えて、検証できるのは、ええと、その、ええと、基本的には情報の出所と履歴、この知識資産の履歴です。ええと、そして基本的にそれが何をするかというと、この知識の発行者が誰だったのかを見ることを可能にします。ええと、それは実際には一連のステートメントです。

そして、読んでいる情報の完全性も検証できるので、インターフェース自体の信頼性は、先ほど言ったように、この大きな構成要素の一つです。つまりインターフェース、そのウェブサイト自体、あるいは何らかのモバイルアプリを通じてこれを見ている場合でも、あなたを騙すことすらできません。ですから、元のソースからこの知識資産を照会している人への伝送の過程で、情報を改変したり、何らかの中間者攻撃を行ったりする方法はありません、ええと、なぜなら、その、その、ええと、最終的に、ええと、ええと、最後にこれを照会している人が、実際にブロックチェーン上で完全性を検証できるからです。そしてそれについては、ええと、次のスライドの、ええと、非常に、ええと、短い、ええと、ええと、次のスライドの一つで説明します。しかし要するに、重要なのは、出所、ソース、そして更新の履歴の両方、ええと、作成を含めて、ブロックチェーン上で見ることができ、改ざん耐性のあるブロックチェーン証明を持っているということです。

最後に、これらすべてが揃うと、この知識、ええと、これらの知識資産を使って信頼できるAIシステムを構築できます。ええと、それが意味するのは、AIシステムがその、その、知識資産を照会するたびに、ソースを見ることができ、履歴の完全性を検証でき、その上であらゆる興味深いクエリを実行できるということです、ええと、なぜなら、基本的にこの、ええと、信頼された知識資産の集合体があるからです。そして今日はそれをお見せします。ですので、ええと、もしこれが100%明確でなかったり、十分に深くなかったりしたとしても、それには理由があります。信じてください、私はこのプレゼンテーションをしばらく行ってきましたが、ブロックチェーン、AI、ナレッジグラフを組み合わせているため、少し混乱しやすいのです。

ですから、プレゼンテーションの、の、の中でいくつかのことを繰り返し説明しようと思います。ええと、いくつか質問が見えますので、すぐに答えられるかもしれません。質問があります。NFTはどのチェーン上で作成されるのですか？非常に良い質問です。ええと、そして、ええと、手短に答えてから、後でもう少し文脈を追加します。Origin Trailは実際には分散型ローンチグラフです。

それは、ええと、それ自体はブロックチェーンネットワークではなく、むしろマルチチェーンの、ええと、分散型ローンチグラフがさまざまなブロックチェーンに接続するものです。そして、ええと、それがローンチされたとき、Ethereum 2008上でローンチされました、ええと、2018年です、失礼しました。その後、ネットワークをPolygon knows thisなど、いくつかの他のブロックチェーンに拡張しました。ええと、そして最近、かなり前の1年前から、ええと、ええと、Origin 12向けにカスタムローンチされたpolka dot power chain上にも展開しています。つまり、それはOrigin 12 Power Chainと呼ばれています。

しかし、ええと、手短に言うと、この技術のポイントは中立であるということで、本質的にこの技術を統合したい各ブロックチェーンコミュニティが統合できるようにするものです。ですから答えは、どのブロックチェーンコミュニティが、その、分散型ナレッジグラフをサポートしているかであり、ええと、そこが基本的にあなたの N F T をミントできる場所です。つまり、ナレッジアセットを作成するときに、あなたは選びます、つまり、このナレッジアセット、N f t を Ethereum、あるいは hypnosis、または他の任意のチェーン上でミントしたい、と言うわけです。これが簡単な答えで、実際にどのように機能するのかは後でもう少し詳しく説明します。ええと、もう一つの質問は、ブロックチェーンを使うとデータアクセスの帯域幅が減るのか、というものです。これも非常に良い質問です。

ええと、短い答えはノーです。つまり、アクセスのための帯域幅、帯域幅はブロックチェーンによって制約されません。ええと、しかし、公開するための帯域幅、つまり、新しい知識を、その、この時間化された知識に導入するための帯域幅は、当然ながら制約されます。ええと、ここで見ている帯域幅には2種類あります。1つは、例えば頻度です。

時間の経過とともに、いくつのナレッジアセットを作成できるのか？そしてもう1つは、これらのナレッジアセットがどれほど大きくなれるのかです。ですので、この説明は後ほど適切なスライドのところまで取っておきます。ですから、忘れないように質問は開いたままにしておいてもよいかもしれません。ええと、しかし本質的には、ええと、その半分については、答えとして、アクセスのための帯域幅は実際には影響を受けません、ええと、ええと、なぜならそれはブロックチェーンを通らないからです。すぐにお見せします。

それでは、はい、これについて基本的にもう少し詳しく説明します。かなり複雑になり得るからです。イメージできるのは、本質的に3層アーキテクチャです。ええと、このレイヤー1は、私が述べた複数のブロックチェーン、あるいは私たちがマルチチェーン・コンセンサス層、origin trail レイヤー2と呼ぶもので、これは分散型ナレッジグラフになります。それ自体が独自のネットワークです。ええと、1つのネットワークです。

ええと、もし web three に触れたことがあるなら、I P F Ss のようなものと似たようなカテゴリに入れられるかもしれません。これは、ええと、データストレージネットワークであり、ええと、これもピアツーピアの分散型ネットワークです。しかし、コンセンサスはありません。つまり、その、その、その、スループットの制限がないということです。本質的に IP F Ss ネットワーク内のノード、また origin trail の分散型大規模ネットワーク内のノードも、コンセンサスに到達する必要はありません。なぜならデータは本質的に複製されるからです。ええと、ただし I P F SS と、ええと、Origin Trail の違いは、I P F SS は本当にデータストレージのためのものだということです。一方 Origin Trail は、よりナレッジグラフ、データベースのようなものですよね？つまり、さまざまなタイプのクエリを素早く送ることができます。

より多くの構造を持ち、ええと、追加し、ええと、当然ながらナレッジグラフの機能を追加しています。ええと、しかし現在、Origin Trail バージョン6の最新バージョンを実行している約155の異なるノードが世界中に分散しています。誰でもノードを運用できます。ですから、今日この通話に参加している人は誰でも、ただ、私たちのウェブサイトに行って、ノードをダウンロードし、自分のコンピューターやクラウド環境、どこでも調整できる場所で実行できます。そして、ええと、ノードを設定した後、あなたのノードはネットワークの一部となり、ナレッジアセットのホスティングを開始します。

ええと、つまり、ええと、実際にはこれらのナレッジアセットをホスティングすることで報酬を受け取ります。ですから、もし私が今ナレッジアセットを作成するとしたら、ええと、ブロックチェーンを使うのと同じように、例えば誰かにトランザクションを送りたい場合、手数料を支払わなければなりません。ええと、同じように、ナレッジアセットを作成したい場合、手数料を支払わなければなりません。そしてその手数料は、私や私たちの会社のような中央機関には行きません。いいえ、それは実際にこの、このナレッジグラフをホスティングしているノードに行きます。つまり、すべてのナレッジアセットは本質的に複製され、ええと、特定の、ええと、ええと、本質的に、ええと、D H t のような原則に従って、知識が、ええと、ネットワーク上でコンテンツアドレス指定され、かつ複製されるようになっており、その結果、ええと、ええと、非常に、非常に、ええと、障害の可能性が最小化されます。

そして、すべての知識アセットには特定のトークンのセットが付随しており、ええと、それらをホストしているノードは、実際にホスティングを完了した後にそれを受け取ります。ええと、つまり、ある種の従量課金制システムのようなものです。ええと、最後に、この2層のインフラストラクチャの上に、知識アセットアプリケーションがあります。つまり、今日お見せするようなアプリケーションで、基本的にこれらの知識アセットを使用し、この知識を検証し、作成し、ええと、接続し、そしてクエリする、といったものです。ですので、先ほど言ったように、まとめると、これはマルチチェーンの分散型モデルグラフです。

実際には、W three C、分散型識別子、クレデンシャルデータモデル、ブロックチェーンの世界のE R C標準、たとえばseven to oneやNFTs、GS one標準といった標準に基づいています。これらは、先ほど述べた事例のように、サプライチェーンにとって実際に非常に関連性があります。ええと、私が言及したこれらのuniform asset holは、基本的には知識アセットのための標準化された識別子です。そして、ええと、origin to repair chainについて触れたとき、私は実は、ええと、もう一つ強調し忘れたことがあります。それは、ええと、まもなく、ええと、そしてそれがそこにある理由の一つなのですが、まもなく、知識創造に対するインセンティブを実行し始めるということです。つまり文字通り、あなたが来て、何らかの知識を作成すると、見返りにいくらかのトークンを受け取るということです。つまりO T P origin, trail ing tokenは、本質的に知識創造とこのインフラストラクチャの運用をインセンティブ付けするように設計されています。ええと、たとえばBitcoinがインフラストラクチャ運営者、Bitcoinにおけるマイナーなどをインセンティブ付けするように設計されているのと同じようにです。

ええと、多くのユースケースがあります。これは非常に、ええと、知識グラフのように広く適用可能な技術だからです。あらゆる種類のことができます。レコメンダーシステム、検索および発見エンジン、QMシステム、ええと、しかし通常は知識、ええと、知識グラフとは関連付けられないものもあります。知識グラフは通常中央集権型ですが、ええと、たとえば知識マーケットプレイスのようなものです。それもまた、よりクールなものの一つです。知識集約、異なる、ええと、ステートメントのマルチパーティ検証などです。ですので、それが、たぶん、そして可能な限り短い説明で、ええと、3つのレイヤーとそれらがどのようにつながるか、ということです。ええと、そうは言ったものの、1つの知識アセットはどのように見えるのでしょうか？これは知識アセットの解剖図のようなものです。

私たちは知識を持っています。もちろん一番上に、知識は何らかの、何らかの知識を含んでいます。そしてここで特に意味するのは、この場合、R D F構造化知識です。なぜならこれは知識revの世界であり、R D Fは、ええと、JSON ldから簡単に生成できるからです。もしJSONデータ構造に出会ったことがあるなら、おそらく、あなたがビルダーならおそらくあるでしょうが、JSON LDはその拡張のようなものです。これにより、このJSONオブジェクトが、ええと、本当にグラフオブジェクトになります。そしてここでは、ええと、知識アセット内の、ええと、イベントを記述するエンティティの例を見ることができます。

そして実際、これは私たちが今から1か月後に開催するカンファレンスです。ええと、ちなみに皆さんも招待されています。オンラインでも、そしてオフラインでも開催されます。ええと、そしてこのイベントには、ええと、基本的に特定の識別子があり、それに接続された特定の、ええと、オブジェクトがあります。たとえば、場所のようなもので、それにも型などがあります。つまり、このcontext type IDなどの拡張です。

これは基本的に、JSONの上にある一種の拡張で、jsonのような単純なキー・バリュー構造を、実際にグラフベースの構造にすることを可能にします。そしてそれをこのR D Fに変換できます。ですので、知識アセットを作成することは、そのようなJS LDオブジェクトを作成することだと考えてください。そして基本的にdkg createでこのコマンドを実行すると、この知識がネットワーク全体に複製されます。それはこのように見えるuniform asset locatorを生成します。

D K G は実際に何かというと、これは分散型識別子を意味し、いろいろなものを含んでいます。深くは立ち入りませんが、ここで本当にすごいのは、自己参照解除が可能だということです。つまり、d n s のような別の中央集権型システムがどこかに必要なわけではありません。むしろ、あなたのクライアント、つまりブラウザがこれを実際に読み取って理解できます。ああ、これはブロックチェーンだ。この記録を確認しに行く必要がある。これはブロックチェーン上のコントラクトだ。これは私が探している実際のグラフ、ええと、グラフエンティティだ、という具合です。

ですから、そのための仲介者や、ある種の中央集権型インデックスが必要になる方法も理由もありません。実際、この下部にある D K G インデックスは、基本的にこのような形で実装されています。つまり、これによってこのナレッジをクエリできますし、このナレッジ N F T を見つけたり、これらのナレッジ状態証明、ステートプルーフを取得したりできます。開発者であれば、おそらく Git や GitHub を使っているでしょう。たとえば git commit を作成すると、コミットハッシュが得られますよね？ここでも非常によく似たものです。つまり、これは本質的には上のナレッジのハッシュです。

ただし、ええと、これは単純なハッシュではなく、実際には Merkle ハッシュであり、それによって非常に面白いことがいくつか可能になります。これもまたそれ自体が一つのテーマですが、要するに、特にブロックチェーン側の観点から言うと、ご覧のとおり、ピンク色の部分がブロックチェーンに保存されるものです。つまり、ブロックチェーンは N F T と小さなハッシュだけを保持します。これはつまり、私たちがブロックチェーンをある意味で最小限の方法で使用しているということであり、そのためトランザクションはかなり安価になります。私たちは大量のデータをブロックチェーン上に置こうとしているわけではありません。多くの人がそれを試みますが、私たちの経験からすると、それは良い考えではありません。

それには非常に単純な理由がいくつかあります。まあ、それは、そのために設計されていないからです。データベースではありません。ですから、たとえ大量のデータやナレッジをそこに入れたとしても、ブロックチェーンにはクエリエンジンが組み込まれていません。ええと、そして本当に高額です。どのブロックチェーンを使ったとしても、結局は法外に高くなります。

つまり本質的に、origin 12 dkg はこの問題のこちら側も解決し、法外に高くない分散型ネットワークを実現しています。ええと、それはいくつかの異なる方法を通じて可能になりますが、同時にブロックチェーンの性質を利用し、基本的にそれらの性質を継承しています。たとえば、任意の大きさのナレッジを取ることができます。たとえば 10 メガバイトか何かのようなもので、通常であれば 1 つのトランザクションとしてどのブロックチェーンにも収まりません。通常、制限はキロバイト単位かそれ以下ではるかに小さいです。ええと、とにかく、ある程度大きなグラフを取り、この Merkle 証明とこのハッシュだけを生成することができます。

このもの、つまり 32 バイトのハッシュが、ええと、ブロックチェーン上の値になります。そしてこれの面白い点は、その後、このグラフの一部、どの部分でも取り出して、実際にこのものがナレッジアセット全体に含まれていることを示すための Merkle 証明と呼ばれるものを生成できるということです。これらは包含証明と呼ばれ、本質的に誰かを信頼する必要なく計算できます。数学だけを信頼すればよく、たとえばこの名前がここに実際に含まれていることを計算できます。ええと、たとえコンテンツ全体を持っていなかったとしてもです。これもまた、まったく別の話で、今はあまり深くは入りませんが、ええと、後でそれについて質問があれば喜んでお答えします。

そして本質的に、これらの知識資産、つまり、つながっている4つのもの、N f t、証明、ul、そして知識は、これら2つのレイヤーにまたがって存在しており、ええと、あらゆる種類のクールなことを可能にします。ですので、ええと、クールなことの1つであり、今日私がお見せするのは、まさにこのシンボリックAIとニューラルAIの相乗効果です。つまり、非常に高度に構造化されたデータを持つ知識グラフという考え方と、非常に非構造化された、ええと、データへのアクセスや、例えば、大量のテキストを取得してそれをベクトル化し、埋め込みを作成するといったアプローチを組み合わせるという考え方は、本当に興味深いものです。特に最近、知識グラフの世界では、この2つのアプローチのつながりが、非常に興味深い知識グラフ埋め込みを作成し、リンク予測や知識グラフの補完といった非常に興味深い知識グラフの問題を解決することを可能にしています。ええと、繰り返しますが、非常に大きなトピックで、研究として非常に興味深く、私たちはこれがAIの世界における次のブレークスルー領域の1つになると信じています。そして、ええと、そうしたことを踏まえると、生成側では多くのことが起こることになるでしょう。

しかし、今日は少し異なることに焦点を当てます。再生成というよりは、既存の信頼と知識を検索することに焦点を当てます。ええと、そこで知識資産アプリケーションの例をお見せします。ええと、ただその前に、いくつか質問が見えています。私が、ええと、話に入る前に、人々の頭の中で消えてしまうかもしれないので、実際に少し休憩してこれらの質問に答えようと思います。質問は、ノードオペレーターはt pで支払われるのか、それともtraceで支払われるのか？はは、わかりました。Origin 12のウェブサイトでより詳しく説明されていますが、簡単に言うと、皆さんが見た2つのレイヤーには、ブロックチェーンレイヤーと知識グラフレイヤーがあります。

知識グラフレイヤーのノードは、知識の公開に対して、実際にtrace trackトークンで報酬を受け取ります。これがこのレイヤーのユーティリティトークンです。ええと、しかし、ブロックチェーンレイヤーでは、ええと、その、ユーティリティはブロックチェーントランザクションですよね？ですので、どのブロックチェーンを使うにしても、その、ええと、ブロックチェーンのトークンをorigin power chainで使用する必要があります。そのトークンがO T Pです。しかし、もし価値ある知識を公開していて、ちなみにそれはコミュニティが決めることですが、ええと、実際には知識公開者としてO T Pを受け取ります。つまりtraceを使いますが、O T Pを得るのです。少し、ええと、少し複雑ですが、現在オープンなR F C、origin trailコミュニティR F C、ええと、18があり、ええと、これを説明しています。

ええと、それは私たちのGitHubで入手できます。ですので、ええと、後でリンクを共有できればとても嬉しいです。ええと、公開はどのように、出版社はジェンダーに対してどのように価値検証されるのですか？わかりました、ええと、その質問は、誰かがグラフに公開した知識が本当に真実かどうかをどうやって知るのか、という意味だと理解します。短い答えは、わからない、です。短い答えは、本質的には誰でも何でも公開できるということです。インターネットのように。インターネットは、誰でもただ何でも掲載できる自由な環境ですよね？ですので、それが真実である必要はありません。

そしてそれはインフラストラクチャの観点から見ると、数枚前のスライドに戻ると、このあたりですが、この非常にシンプルなレイヤーインフラストラクチャを見ると、基本的に色の付いた部分がインフラストラクチャです。origin failのインフラストラクチャは中立であるように設計されています。ええと、中立性、包摂性、使いやすさといった一定の原則があり、私たちはそれらを常にエコシステム全体の開発を導くために使用してきました。そしてこの中立性の大きな部分がインフラストラクチャです。私たちは、それは中立である必要があると信じています。

つまり、インフラストラクチャは、何かが真実かどうかを判断できるべきではないということです。本質的に、今日の時点では、何かを入力すると、それが真実かどうかを教えてくれるアルゴリズムはありませんよね？それはまだ存在していません。しかし、私たちはそのようなものに収束しつつあります。そしてそのようなものには間違いなく、ええ、これらの、ええ、インフラストラクチャが提供するものが間違いなく必要です。つまり、それは、何かを公開した情報源が、実際にそれを特定の形式で公開したことを検証する能力を提供します。

だからこそ、これらのブロックチェーン証明があるのです。しかしさらに、それは他の人々が公開したさまざまなステートメントを結びつける能力も提供します。多くの人が多くのものを公開でき、非常に簡略化した言い方をすれば、Noje assetアプリケーションがそれをどう解釈し、何かが有効かどうかを理解するかを決定することになります。たとえば、ええ、いわゆるマルチパーティ検証システムを考えてみましょう。多くのパートナーによって作成された特定の一連のステートメントがあると想像してください。

たとえば、あるステートメントが、ええと、今サンフランシスコは昼間だと言っているとします。そして、うーん、それは問題ありません。窓の外を見れば簡単に確認できることです。ええ、しかし、うーん、それについては、ええ、さまざまな当事者がこれを証明できるものとして考えることもできます。ローンチグラフか何かにステートメントを作成するのです。あるいは別のものでもいい。これは、うーん、コンセンサスのシステムに似ています。

ええ、たとえばブロックチェーンOracleにも見られます。Chain Linkのようなシステムや、一般的なブロックチェーンのコンセンサスです。その考え方は、複数の当事者が何らかの形で収束し、何らかのルールに基づいて、はあ、これは真実だ、と言うというものです。うーん、しかし、そのようなルールはインフラストラクチャには組み込まれていません。それはアプリケーションレベルで行えることです。ええ、要点は、インフラストラクチャはすべてのものを何らかの形で一緒に集め、集約し、それらをクエリできるようにするために使われるということです。そしてそれらを取得したとき、うーん、ナレッジとして、あなたはそこで、なるほど、つまり、情報源は何か？ Fox NewsなのかCNNなのか、あるいはロシアのテレビなのか、などと評価できるようになります。そしてその情報源、うーん、そして情報源の評判に基づいて判断しますが、ちなみにそれもインフラストラクチャの一部ではありません。

私たちはそれをアプリケーションレイヤーの一部として見ています。そうすることで、あなたは見分け、そして決定を下すことができるようになります。ええ、OriginTrailエコシステム内には、あるプロジェクトがあります。彼らはそれをtruth chainと呼んでいて、実際にコンテンツの検証のための、ええ、特定のプリミティブを可能にしています。うーん、しかし、それは、ええ、研究と構築が進行中の領域です。うーん、そして次の質問ですが、それはあり得るバイアスに影響しないのか？うーん、まあ、私たちは、バイアスを少し違う角度から見ています。ええ、たとえば、誰かが、うーん、もしあなたが、たとえばナレッジグラフの世界に慣れているなら、ちなみに、ナレッジグラフは、うーん、Netflixのような企業の中に存在しています。

彼らはそれを使って、あなたに、ええ、あなたが、何を、つまり、あなたの履歴に基づいて何を見るべきかを推薦します。あるいはGoogle、彼らはナレッジグラフを発明しました。あるいは、ええ、Uberもナレッジグラフを使っています。うーん、多くの企業が、うーん、基本的にそれを使ってあらゆる種類の情報を統合していますが、彼らはそれを中央集権的な方法で使い、そしてそれをガバナンスしています。ですから、それは、たとえば彼ら自身や彼らのユースケース、彼らが信じていることなどに向けてバイアスがかかっています。うーん、origin 12はその点で異なります。というのも、私たちはテクノロジー自体に、その意味での、いわばバイアスが組み込まれていないことを保証しているからです。つまり、それが私たちやOriginTrailのビルダーの都合のよい方向に向かうのではなく、誰でも何でも公開でき、何でも他の何かに接続できるのです。ちょうどインターネット上と同じように。

そして、その上にアプリケーションを構築するときには、これを、また、賢いやり方で使い、どうにかして意味を見いだすかどうかはあなた次第です。ええと、しかしバイアスそのものについて、インフラの観点から私たちが見るものは、何らかの特定の、ええと、たとえばフィルタリング技術やコンテンツに関する何らかの判断があり、それをインフラ自体が強制する場合でしょう。だからこそ、インフラはそもそもいかなるコンテンツも強制しません。ええと、コンテンツに関するいかなるものも、何も強制しません。むしろ、物事をより、たとえば、より標準化すればするほど、知識をより良く構造化すればするほど、標準をより使えば使うほど、より、わかると思いますが、それを、ええと、たとえば、クエリ可能にすればするほど、発見しやすくなり、より多くの人が見つけられるようになります。

つまり、ええと、本質的には、それは構造化をある程度促進するだけで、どんなコンテンツなども促進しません。ええと、なので、これがいちばん手早く短い答えのようなものだと思います。そして時間があまりないので、例を示すためにこのまま進めます。先ほど言ったように、アプリケーションの例を示します。Origin Trail 上にはさまざまなアプリケーションを構築できます。ウェブサイトでもっと見てみることをお勧めしますが、これは Millsand Origin Care に基づく抽出的質問応答に関するものになります。

そして、ええと、実は、ええと、簡単な、ええと、図がありますので、そのあとアプリに入ります。この図では、たとえば4つのエンティティ、実際には5つですが、ええと、論理的には4つあります。左側には信頼できるAIアプリケーションがあり、これは origin, trail, knowledge, assets, origin, trail, dkg を使用します。ええと、何らかの形でこれは知識を見つけることができ、その知識は明らかに以前に何らかの知識ソースから作成されたものです。冒頭のスライドを覚えていれば、私は、知識アセットを作成して所有し、それを発見し、検証し、利用できると言いました。

ここでも同じプロセスをたどります。知識ソースがあると想像してください。その知識ソースの一つをお見せします。たとえば、knowledge in trail node を実行することで、そこから知識アセットを作成できます。それができます。ええと、そしてクールなのは、それを vus と接続できることです。

つまり、基本的にこの知識から embeddings を作成し、ええと、ええと、VUSs、ええと、vector db に投入できます。ええと、最終的にこれらの知識アセットを、そのナレッジグラフに公開します。つまり、この知識を基本的に作成し、きれいに構造化してベクトル化したら、それを origin 12, D K G に公開し、発見可能にします。そうすると、たとえばQAシステムのような信頼できるAIアプリケーションが、この知識を発見できます。この後のステップで見られるとおりです。そして、ええと、たとえば彼らができることの一つとして、今日お見せするのは、ええと、ユーザーが質問を入力する、または質問を発話する、あるいは何らかの形で質問を思いつくと想像してください。ええと、信頼できる答えを見つけようとしているわけです。

通常は、たとえば、ただ、ただ VUSs だけでもそれができます。何らかの、ええと、ベクトルベースの検索を、ええと、ある知識ベース、ええと、または VUSs db 内のインデックス化された情報セットに対して行うことができ、それは、ええと、ベクトル化された、ええと、基本的に類似性に基づくベクトル検索結果を返しますよね？ええと、それは本当に素晴らしいです。そして、ええと、それをさらに拡張する素晴らしい点は、私たちには quicks があるという知識です。たとえば、私たちは、類似検索によって質問に直接答えるだけでなく、ええと、それでも本当に素晴らしいことができますが、利用可能な他の質問やコンテンツとのベクトル類似性を見つけることで、質問の意図を判断することもできます。このアプリケーションでは、それをまさに行っています。

つまり基本的に、私たちは意図を判定し、意図を判定すると、ああ、これは実際に特定のモジュールクエリのセット、あるいは1つのクエリに適合しているのだ、と分かります。そして、この特定のケースでは、ナレッジに対して直接クエリを実行します。つまり私たちの場合はデータベースクエリのようなものです。なぜなら、セマンティックウェブ標準を使っているからです。これはSPARQLクエリで、そしてそれを類似検索の結果と組み合わせて、最終的に一連の結果を生成します。ええと、そしてこれらの結果はすべて、繰り返しになりますが、私たちがナレッジバンクと呼びたい、OriginTrail、node、そしてsという技術の組み合わせから抽出されています。

そこには他にもいくつか詳細がありますが、簡単に言うと、これらが2つの主要なコンポーネントです。ええと、それから、ええと、この情報を抽出することで、ええと、ブロックチェーン上でソースとデータの整合性を検証することもできます。そして実際に、それを別のブラウザウィンドウで、ごく簡単にお見せします。では、ちょっと待ってください、どこかここにあります。はい。

では、更新します。はい、これは実装例で、この部分をお見せします。もちろん、フロー全体をお見せすることはできません。すでにナレッジアセットを作成しているので、例えば、ええと、ここに2つの例があります。ええと、私たちが取り組んでいるAgriFoodのケースの1つの例です。つまり、シンプルなチャットボットを想像してください。ただし、ある種2つのモードがあります。

1つのモードは情報を抽出する、基本的にはこれらのクエリを実行するだけのものです。あるいは、l l mを使って抽出して要約する、ある種別のものがあります。ええと、両方お見せしますが、基本的には、ええと、簡単な質問をします。ええと、このケースのコンテキストを説明する必要があります。つまり、これ、この特定のデモが想定しているのは、皆さんが見てきたように、私はディスカバリーのステップをお見せしていません。ええと、あなたが店に行って鶏肉を買ったと想像してください。ええと、基本的には、分かりませんが、チキンレッグのようなものです。

ええと、ええと、これを言っているのは、これは実際に私たちがヨーロッパで取り組んでいる実際のケースだからです。ええと、特定のコードをスキャンして、この、この、ええと、U R Lにたどり着いたと想像してください。ええと、ちなみにこれは標準化もされる予定で、ええと、バーコードの新しいバージョンで、GSS one Digital Linkと呼ばれるものです。ええと、いずれにせよ、ええと、手短に言うと、何らかの方法でこの製品を手に入れ、それをスキャンしてスマートフォンで開くと、ほら、基本的に今あなたはその製品に関する信頼できるナレッジとチャットしているわけです。そしてブランド、ブランド。

例えば、ええと、次のように尋ねることができます。ええと、この、ええと、鶏肉はどこから来たのですか？ええと、またはどの農場、どの農場？おそらくそのほうが良いですね、この鶏肉はどの農場から来たのですか？そして検索をクリックすると、裏側で起こることは、実際にはここでお見せしたことです。なので、少し動かしてみます。つまりこのサイトは、基本的に、今、ええと、ホストされたmillインスタンスを提供する、ええと、そのZeiss、ええと、ええと、プラットフォームに問い合わせることでインテントを判定しています。本質的には少し時間がかかっています。なぜこんなに長いのか分かりませんが、ええと、ああ、ここにあります。そしてその後、実際にナレッジグラフクエリを実行します。ここに表示されている結果は、最も見栄えの良いものではありません。すてきなChad G p Tのようなものではありませんが、これはナレッジグラフからこれらのトリプルを実際に表示する例にすぎません。

つまり、これはfarm idで、これはproduct idです、と言っています。ええと、所有者はStanis volです。なぜならこれはスロベニアの実在する農場だからです。ええと、そして証明書、u r l、いくつかのことを示しています。しかし、この、これは基本的に、ええと、質問の意図について非常に高い確信度を持ち、そして、ええと、農場を見つけるために標準化されたグラフクエリを実行することに基づいて見つかったコンテンツです。

ええと、基本的には、その主要なコンポーネントも示しています。それは u l と所有者を持つソース知識アセットです。このソース知識アセットを開くと、実際にそれを探索できるようになります。これは実際には今、Origin 12、分散型大規模グラフから読み込まれたもので、ズームインすると、そのファームにはこのタイプが設定されているのがわかります。先ほど言ったように、ええと、Jason ld、Stanis Lavo、ええと、住所やその他多くのコンテンツ、たとえば写真などが含まれています。このリンクを開くか、ええと、画像を保存する必要があるのかな。ああ、わかりました。

ああ違う、ここにあります。これはそのファームの写真です。ええと、それに接続された他の知識もたくさんあります。たとえば、ええと、ここでこれらの記号をクリックすると、グラフが成長し始め、追加の知識アセットが開きます。ええと、どういうわけか私は、デモで何かを messed something up してしまいました。ええと、なので元の知識アセットをもう一度開きます。

ええと、ああ、ここです。そしてお見せします。ええと、実際には別の部分です。これはこの知識アセットのためにミントされた N F T です。そして 50 日前にミントされたことがわかります。ええと、それから、ほら、所有者などもあります。

ええと、ちなみにこれは testnet 上のものです。なので、おそらく、ええと、デモとしてあちこちに少し不具合があるかもしれませんが、この知識アセットが、ええと、基本的に、ええと、一定回数更新されたことも確認できます。そしてこれらの各更新について、誰が vsu であるか、そしてこの特定の更新の state hash を見ることができます。ええと、ここにあるこれらの graph resources の観点から、すべてのコンテンツも見ることができます。なので、ええと、このインターフェースを通じてそれらを探索できます。

さて、このインターフェースは汎用インターフェースで、ええと、blockchain explorer に非常によく似ています。このように blockchain に行くと、これは blockchain explorer で、この blockchain 上のすべてのトランザクションを見ることができます。たとえば、この場合、N F T のミントトランザクションを見ることができ、ええと、どれだけのトークンが使われたかなどが表示されます。ええと、非常に似た方法です。これは、その DG Explorer であり、基本的にそこにあるあらゆる種類の、ええと、興味深い知識アセットを見ることができます。

たとえば、別の質問を実行することもできます。こう言えます。ええと、たとえば、ええと、これは、ええと、ええと、ええと、これは、ええと、たとえば、この meet の特徴は何ですか、何が、というように。そしてそれを行うと、別のものもあり、基本的にこちらのほうが速かったです。ええと、本質的には、それが行って、たくさんのグラフ結果を取得しました。それは、ええと、製品説明、製品 Q R L、画像などを見つけました。

ええと、あるいは同じことをして、これを今 L L M に送るとすると、当然 L l M はこれをより見栄えよくしてくれるので、それもできます。私はただ、ええと、もう一度、この mean を送信しているキャラクターは何ですか？と言えます。ただし、extract から extract and summarize モードに切り替えました。そして今、ええと、L l m があります。まあ、しかし、この l l m は再び幻覚を起こす可能性がはるかに低いです。なぜなら基本的にすべてのコンテンツを与えているからです。そしてプロンプトは本質的に、これを受け取って、人間向けに少し見やすく構造化してください、と言っています。なので基本的には、抽出された同じ、ええと、同じ知識を、より良い、より良い表現として与えてくれます。

これらの知識アセットを開くこともでき、すべてを見ていくことができます。つまり、さまざまなものがたくさんあります。ええと、そして、その意味では、ええと、これは、たとえば、ええと、ええと、食品業界向けの一例です。この、ええと、医薬品の例もお見せできます。たとえば、音声でもそれを行うことができます。私たちはごく最近、Google の ai、ええと、ええと、モデルツールで本当に chirp と呼ばれるものを試しました。

なので録音を試せます。ええと、少し時間があれば。見てみましょう。ええと、これでいきましょう。たとえば薬をスキャンします。これでそれに質問できます。

この薬をアルコールと一緒に飲んでもいいですか、例えば。もちろん、そうしましょう。この薬をアルコールと一緒に飲んでもいいですか？ええと、このインターフェースはあまり使いやすくありません。デモなので。でも基本的に、質問は受け取りました。つまり、基本的には N O P がいくらか関わっていて、その結果として、実際には基本的に knowledgeasset に対する単純なセマンティック検索が行われ、ええと、あなたの薬をアルコールと一緒に摂取することは当然ながらしてはいけないことだ、ということが見つかりました。もしこの knowledge asset を開けば、この薬のリーフレットから生成された多くの情報を含む、実際かなり充実した knowledge asset が見られるでしょう。

ええと、つまりそれは非常に、いわばシンプルなアプリケーションで、ええと、ここでチャートに戻りますが、特定のソースから作成された knowledge assets を使用したもので、それらが誰であるかを見ることができます。基本的に、ブロックチェーン上の識別子、つまりこれを公開したウォレットを見ることができます。ええと、そしてそれらがナレッジバンク内できれいに構造化されていたため、発見され、そのような質問応答システムを通じて使用できたのです。ええと、そして T K G が非常に特別である大きな理由の一つは、ええと、それが、ほら、誰もが自分自身の中央集権的なエンティティを使うようなシステムではなく、むしろ分散型ナレッジグラフとして設計されているからです。つまり、多くの異なる人々が共同で、ええと、基本的にそれを充実させることができます。

そして、ええと、充実させることで、異なる knowledge assets 同士を相互に接続することもでき、このような、ええと、大規模で信頼できるナレッジベースを一緒に構築できるのです。ええと、そしてこれにより、ええと、したがってこのインセンティブ化メカニズムこそが本当に興味深いものであり、そして、私たちはそれが、ええと、近い将来に始動するのを見るのを楽しみにしています。そうすれば基本的に、本当に、本当に高品質で信頼できる知識を得ることができます。基本的に、世界最大の、ええと、ナレッジグラフになることが Origin Trail の目指すところです。ええと、また、これを実現するために、私たちは、ええと、chat, D K G と呼んだものの中で 100 万 track tokens の助成プログラムを開始しました。つまり、ええと、もちろんしゃれを込めていますが、このプログラム chat, D K G は、本当に、ええと、ええと、信頼できる AI ツールを構築するためのビルダープログラムであり、ええと、基本的に誤情報と戦うためのもので、ええと、knowledge assets に基づいています。

ええと、この cure code をスキャンすると、Chad and g ai というウェブサイトに移動します。これは本当に、このプログラムのすべての詳細を見つけられるリポジトリであり、助成金への応募方法や、どのタイプのアプリケーションが対象となるかも含まれています。例えば、私が今お見せしたものに似た質問応答システムで、ええと、オープンソースであり、ええと、コミュニティと一緒に構築するものは、ええと、そのような scratch の対象となるものです。ですから、もしあなたがビルダーなら、ウェブサイトにアクセスしてください。ええと、ぜひお会いできればとても嬉しいですし、ええと、また、ええと、私たちの Discord でもお会いできればと思います。ええと、以上を踏まえて、そしてもうほとんど時間の終わりなので、Intel の故創業者 Robert Noyce の最後の引用でここを締めたいと思います。彼は、知識は力であるが、知識の共有は力を倍増させる、と言いました。そしてそれが、Origin Drill で私たちが掲げているモットーです。

ええと、皆さんありがとうございます。たくさんの質問が見えています。ええと、でも、うーん、それらに入る前に、私は、ええと、手短に、ええと、Eugene、あなたに移りたいと思います。ええと、うーん、この質問応答を続けるため、ええと、または、ええと、ただ、ええと、このトピックについてあなたの考えを述べていただければと思います。ところで、残り時間はどれくらいですか？ 8 分ですか？はい、残りはだいたい 8 分です。では、ええと、質問に入りましょう。ええと、かなり多くの質問がありましたので、ええと、まずは、質問を優先できると思います。そして最後に時間があれば、そこで少し考えを述べられます。

ええと、素晴らしいです。では、よろしければ、最初の質問から始めてください。もちろん、もちろん。はい、私が、私が進めます。

ええと、たぶんハルシネーションは自然言語の曖昧さの一部で、それが人間が数学を発明した理由です。N L P と正確性の間にあるこの二分法を、私たちはどう解決していくのでしょうか？ああ、実は、ええと、私のこの質問の理解の仕方としては、私は実はこれが本当に好きです。なぜなら、ええと、あなたは本当に興味深いことを言ったからです。ええと、曖昧さと数学です。ええと、ナレッジグラフの世界では、ええと、数学は本質的にこの方法、あるいは知識を提示する方法、R D F やオントロジーと呼ばれるもののような数学を備えた技術に相当します。たとえば、ナレッジグラフの数学とは実際には、特定の知識領域を定義するこれらのオントロジーです。ええと、そしてそれは本当にすばらしいことです。なぜなら、ある特定の知識領域を分割、定義すれば、それは本質的に数理論理学に非常に似ており、したがって大規模なグラフレベルで推論を行うことができるからです。

ですから、ええと、たとえば、ええと、ええと、グラフ接続の能力を活用することで、非常に簡単な推論を行うことができます。たとえば、ほら、ええと、ある人が親族であると推論するようなことです。ちなみに、これがナレッジグラフで通常使われるのは、多くの場合、不正検知です。ですから、ええと、この推論に基づいてグラフ構造の類似性を検出する方法があります。これは非常に、非常に広いトピックですが、本質的には、N L P で得られる曖昧さ、そして一般的な正確性に対する、本当に良い基盤づけの、ええと、ツール、あるいは、ええと、曖昧さなのです。ですから私は、このトピックをより深く掘り下げるために、ナレッジグラフの、ええと、推論とオントロジーについて調べることをお勧めします。

ええと、繰り返しますが、これらはあくまでその助けとなるツールであり、世界全体を解決するものではありません。ええと、わかりました、次に進みます。lmm のユーザーが正当化される段階を見逃しました。オントロジーの内部問い合わせのベクトルを入れることで、sparkle を使ってすでにエラーなく正確にナレッジベースを照会できます。あなたはただ、ある程度、sparkle の代わりに人間の言語によるクエリインターフェースを得ているだけなのですか？ええと、ですから、ええと、知識とナレッジグラフとやり取りするための、はるかに簡単な方法を追加しているのです。

そして、ええと、本質的に私がこの図に戻るとしたら、D L M は見えないでしょう。ええと、もちろん、ええと、より簡単な検索を可能にするために、ええと、作成ステップの中で埋め込みの集団がありましたし、私が言ったように、ベクトル類似検索はこのサンプルアプリケーションの一部です。ええと、そしてそれにより自然言語でのクエリが簡単になります。これは本当に重要です。なぜなら、sparkle を知っている人は多くないからです。そして、ええと、私は、ナレッジグラフとして今日具現化されているセマンティックウェブというこの偉大なアイデア全体の大きな理由の一つは、まさにそれが複雑すぎたからだと信じています。Tim がそれを思いついたとき、つまり20年以上前ですが、それは素晴らしく、驚くべきアイデアでした。しかし、それは、本当に複雑になりました。

そして、その理由の一つは、ほら、このユーザビリティです。だからこそ、ユーザビリティは Origin Trail の背後にある大きな原則なのです。これらの技術は使いやすくなければならず、ええと、これはそれをはるかに簡単にする一つの主要な方法です。ええと、しかし繰り返しますが、あなたは LM に問い合わせて、ほら、あなたへの回答を生成させているのではありません。実際にはせいぜい質問をベクトル化しているだけなのです。

ええと、そして理想的には、どうにかして、単に非常に基本的なベクトル類似検索を使っているだけではなく、どうにかして質問の意図を理解しようとし、そのうえで非常に厳密な、あえて言えば、ナレッジグラフクエリを行うのです。ええと、わかりました、もう一つ質問です。もしそうなら、ベクトル化の近似的な性質によるエラーをどのように軽減するのですか？とても良い質問です。それは、私が今、ええと、簡単に述べたことに関連しています。ですから考え方としては、ええと、これを観察するのではなく、これはシステムです。そのため私たちは実際に Trusted Semantic search app と呼びました。質問には一つの正しい答えがあると考えるのではなく、あなたに、ええと、タッチ結果を提供するタッチシステムには、ええと、果たすべき約束が少し少ないのです。

つまり、彼らは「私は真実を伝えています」と言うのではなく、むしろ、むしろ、「私はデータベースやナレッジグラフからの一連の結果をあなたに提供しています。ええと、その情報源や整合性、そしてこのすべての情報を検証できますが、同時に、それをどう扱うかはあなたが決められます」と言っているのです。ですから、ええと、最終的には、ええと、その、その最終アプリケーションが、まさにそのトピックのために、どうにかしてこのすべての情報を処理する責任を負うことになります。冒頭で、その、そのバイアスについて触れました。ですので、ええと、要するに、lms の使用を最小限に抑え、ええと、ナレッジグラフクエリの使用を最大限にし、そしてまた、クエリを行っている人のために最終判断を下すのではなく、ええと、一種の検索結果システムを通じてこの情報を発見できるようにする、ということです。ですので、これが、限られた時間の中でできるだけ短い答えになります。

ええと、皆さん、素晴らしい質問をありがとうございました。これは、ええと、本当に的を射ていて、まさに核心を突いていました。さて、締めくくるには素晴らしい、ええと、最後の質問でした。そして、ちょうどほぼ1時間の終わりに差しかかっているところでもあるので、残りは数分しかありません。では、ええと、ここで締めくくりましょう。

ええと、皆さんご参加いただきありがとうございました。そして、ええと、Brian Amir、素晴らしい、ええと、プレゼンテーションをありがとうございました。ご招待いただき本当にありがとうございます。そして皆さん、ありがとうございました。ええと、ついてこられていたら嬉しいです。ええと、議論を続けたい場合は、ぜひ私たちの Discord に参加してください。あるいは Twitter、LinkedIn、telegram、その他何でも私に連絡してください。私は、私はどこにでもいます。ですので、ええと、皆さん改めてありがとうございました。

良い一日を。そして残りの一週間も。

OriginTrailとMilvusでハルシネーションのないセマンティック検索アプリケーションを構築する

Join the Webinar

Meet the Speaker

Join the session for live Q&A with the speaker

Branimir Rakic
Founder and CTO, Trace Labs
As the founder and CTO of Trace Labs (core developers of OriginTrail), Branimir has been the architect and creator of the OriginTrail Decentralized Knowledge Graph (DKG), designed for making AI-grade knowledge assets discoverable and verifiable across the web. Branimir has been particularly focused on networking problems throughout his career, spanning decentralized networks (apart from DKG he also has vast experience in Ethereum and Polkadot ecosystems), semantic networks and even mobile networks. Being a strong advocate of open source and permissionless systems, Branimir is active in standards development working groups within GS1 and various blockchain communities, a member of the Serbian Entrepreneurs collective and an alumni H-Farm accelerator.