ブログ
ANN機械学習について知っておくべきすべて

ANN機械学習について知っておくべきすべて

Dec 02, 20220 min read

ANN](https://zilliz.com/glossary/anns)（人工ニューラルネットワーク）とは何かを理解するためには、まずニューラルネットワークとは何かを理解する必要がある。あなたの脳と同じように、ニューラルネットワークは相互接続された多数のニューロンで構成されている。多くのアプリケーションでは、ニューラルネットワークを使用して、多数の例に基づいて様々なパラメータ間の未知の関係をモデル化します。

手書き数字の分類、音声認識、株価予測などは、成功したニューラルネットワーク・アプリケーションの顕著な例である。

1943年、アメリカの神経生理学者でありサイバネティシャンのウォーレン・S・マッカロク（人工ニューラルネットワークを発明した人物）は、人工ニューラルネットワークの最初の概念モデルを作成した。それによると、ニューロンは「神経活動に内在する観念の論理計算」（https://www.cs.cmu.edu/~./epxing/Class/10715/reading/McCulloch.and.Pitts.pdf）と呼ばれている。基本的には、入力を受け取り、それを処理し、出力を生成する細胞のネットワークの中の一つの細胞である。

ベクトル・データベース](https://zilliz.com/learn/what-is-vector-database)とAIテクノロジーのリーディング・プロバイダーであるZillizのこの記事は、ANN機械学習とその仕組みについて包括的な理解を提供している。

人工ニューラルネットワークとは？

人工ニューラルネットワークの定義

人工ニューラルネットワーク(ANN)は入力層、いくつかの隠れ層、出力層で構成され、これらが一緒になってニューラルネットワークの基本構造を構成する。ある層のすべてのノードは次の層のすべてのノードにリンクしている。任意のノードは、非線形活性化関数を使用して、その入力の加重和を処理する。これがノードの出力で、次の層の別のノードの入力となる。

信号は左から右へ流れ、最終的な出力は各ノードでこの手順を繰り返すことで計算され、ニューラルネットワーク構造が完成する。すべてのエッジに関連する重みを学習することが、このディープ・ニューラル・ネットワークのトレーニングである。

人工ニューラルネットワークのアーキテクチャ。出典：http://scientiairanica.sharif.edu/article_4520_0ed0cd925b330c8798c33c951127b09e.pdf](https://assets.zilliz.com/ANN_machine_learning_Image_1_aea4015e57.JPG)

図2は、典型的な人工ニューロンと多層ニューラルネットワークのモデリングを示しています。この図では、入力x1,...,xnからの信号の流れは、ニューロンの出力(O)からの信号の流れと同様に、矢印で示されるように一方向と考えられている。

人工ニューラルネットワーク（ANN）ニューロン。出典：http://scientiairanica.sharif.edu/article_4520_0ed0cd925b330c8798c33c951127b09e.pdf](https://assets.zilliz.com/ANN_machine_learning_Image_2_7f38d11fc0.JPG)

**バックプロパゲーション・アルゴリズム

フィードフォワードANNでは、バックプロパゲーション・アルゴリズムが使われる。つまり、人工ニューロンは層で構成され、信号を「前方」に送り、エラーは後方に伝搬する。入力層のニューロンはネットワークに入力を提供し、出力層のニューロンはネットワークに出力を提供する。

隠れ中間層が1つ以上ある場合もある。つまり、ネットワークに計算させたい入力と出力の例をアルゴリズムに与え、エラー（実際の結果と期待される結果の差）を計算する。

バックプロパゲーション・アルゴリズムは、ANNが訓練データを学習するまで、この誤差を減らすように設計されている。

シグモイド関数は最も一般的な出力関数である。大きな正の数の場合、シグモイド関数は1に非常に近く、ゼロの場合は0.5、大きな負の数の場合はゼロに非常に近くなります。これによって、ニューロンの低い出力と高い出力（ゼロに近いか1に近い）の間をスムーズに移行することができる。

バックプロパゲーション・アルゴリズムは、出力、入力、および重みに対する誤差の関係を計算する。これが決まれば、勾配降下法を使って重みを調整することができる。

最も一般的な活性化関数。出典：Wikipedia](https://assets.zilliz.com/ANN_machine_learning_Image_3_d6cf3422b5.jpg)

より複雑な特徴を表現し、何千、何百万もの特徴に基づくデータの予測や分類のために複雑化するモデルを「読み取る」ために、ANNシステムは人工知能ニューラルネットワークへと進化する必要があった。

ディープラーニングは機械学習の一分野であり、データからますます意味のある表現の連続した「層」を学習することに焦点を当てている。

人工ニューラルネットワークには様々な形態がある。ネットワークは、出力を決定する一連のパラメータと数学的演算を用いて構築される。

人工ニューラルネットワークの主な種類

ANNは、脳の大脳皮質の構造にヒントを得たアーキテクチャで、多数の単純かつ高度に相互接続された処理要素（人工ニューロン）から構成されるデータ処理システムである。

ニューラルネットワークのアーキテクチャにはさまざまな種類がある。最も一般的に使用されているものを詳しく見てみよう：

1.フィードフォワード・ニューラルネットワーク

最も基本的なニューラルネットワークはフィードフォワード・ニューラルネットワーク（FNN）と呼ばれる。これらのFNNは、出力ノードに到達するまで、様々な入力ノードを通して一方向にデータを送る。このネットワークには隠れノード層がある場合とない場合があり、それによって動作がより理解しやすくなる。FNNは多くのノイズに対応できるように設定されている。

データは入力ノードを通ってこのタイプのニューラルネットワークに入り、出力ノードを通って出ていく。このニューラルネットワークでは、分類活性化関数が利用される。必要なのはフロントプロパゲーションのみである。バックプロパゲーションは許されない。

フィードフォワード・ニューラルネットワークは、コンピュータビジョンや自然言語処理などのタスクの中核である。フィードフォワード・ニューラルネットワークは非常にシンプルで、その合理的なアーキテクチャにより、いくつかの機械学習アプリケーションに非常に有益である。

2.畳み込みニューラルネットワーク

畳み込みニューラルネットワークの例。出典：https://studentsxstudents.com/training-a-convolutional-neural-network-cnn-on-cifar-10-dataset-cde439b67bf3](https://assets.zilliz.com/ANN_machine_learning_Image_4_787c3bfa79.jpg)

畳み込みニューラルネットワーク](https://zilliz.com/glossary/convolutional-neural-network)(CNNまたはConvNet)は、最も一般的なタイプのディープニューラルネットワークである。CNNは学習した特徴を入力データとレイヤー化するため、画像のような2次元データの処理に適している。CNNは手作業による特徴抽出を不要にするので、画像分類の特徴を特定する必要がない。

CNNは画像から直接特徴を抽出する。関連する特徴は事前に学習されていない。代わりに、ネットワークが画像セットで学習する際に学習される。

畳み込みニューラルネットワークが他のニューラルネットワークモデルよりも好まれるのには、いくつかの重要な理由がある。まず、CNNはウェイトシェアリングのコンセプトを採用しているため、学習が必要なパラメーターの数が減り、結果として汎化が向上する。パラメータが少ないので、CNNはオーバーフィッティングすることなく、簡単に訓練できる。次にCNNでは、分類の段階が特徴抽出の段階と組み合わされ、両方の段階が学習プロセスを採用する。また、ANNの一般的なモデルを使って大規模なネットワークを実装するのは、CNNを使って実装するよりもはるかに難しい。

CNNはその卓越した性能により、画像分類、物体検出、顔検出、音声認識、リアルタイム自動車認識など、様々な領域で広く利用されている。

3.リカレントニューラルネットワーク

リカレント・ニューラル・ネットワークのアーキテクチャを示す図。出典：https://www.cs.toronto.edu/~tingwuwang/rnn_tutorial.pdf](https://assets.zilliz.com/ANN_machine_learning_Image_5_0a2a8dbe34.jpg)

リカレント・ニューラル・ネットワークは、FNNと同様に、ある瞬間の隠れ層を次のインスタンスの入力として使用できるようにする、自己ループ接続を追加した隠れ層を持つ。ニューラルネットワークモデルの各ノードはメモリーセルのように機能する。受け取った情報を処理することで、これらのセルはインテリジェントな計算と実行を保証するために働く。このモデルは、処理されたすべてのデータを収集し、再利用する能力があるため、ユニークなものとなっている。

リカレント・ニューラル・ネットワークに不可欠なコンポーネントのひとつは、ロバストなフィードバック・ループである。リカレント・ニューラル・ネットワークでは、ニューラルネットワーク技術はエラーから「自己学習」することができる。誤った予測の後、2度目にアルゴリズムにデータを通すと、システムはフィードバックを考慮しながら正しい予測をしようとする。

リカレント・ニューラル・ネットワークは、音声合成、売上予測、株式市場予測などのアプリケーションで頻繁に採用されている。

しかし、バニラRNNモデルには、消失勾配問題として知られる重大な欠陥があり、これが正確性を妨げている。つまり、このネットワークは単語を記憶するのが苦手で、その代わりに直近の単語のみに基づいて予測を行うのだ。

この問題に対処するため、LSTMやGRUなどの後継モデルが導入された。これらのネットワークは、時系列の入力データセットの場合、長期的な相互関係や非線形ダイナミクスを維持できるため、従来のRNNを凌駕する。これらのモデルでは、勾配は変化せずに流れるため、勾配が消失する問題を回避することができる。

ANNを使う利点

人工ニューラルネットワークの3つの主な利点を簡単に見てみよう：

**並列処理能力： **人工ニューラルネットワークは、複数のタスクを同時に実行できる数値的な強さを持っています。

幅広い応用：*どのニューラルネットワークも、機械が人間のように機能するように作られているため、人間の代わりとなるいくつかの利点があり、応用範囲も広い。この技術は、医学、工学、鉱業、農業などの分野にメリットがある。

データ損失がない： 入力はデータベースではなく、独自のネットワークに保存されるため、データ損失は動作に影響しない。

ANN使用の課題

スケーラビリティの問題、テスト、検証、およびニューラルネットワーク・システムの現代環境への統合は、今日の大きな課題である。より大きな問題に適用した場合、ニューラルネットワークプログラムは不安定になる可能性がある。テストと検証は、防衛、原子力、宇宙研究などの機密性の高い産業にとって懸念の種である。

ANNは、構造化された方法論を使って選択、開発、訓練、検証することはできない。ANNの解の質は、学習セットのサイズ、層の数、各層のニューロン数に依存することはよく知られている。

多くの人は、訓練セットのデータが多ければ多いほど、出力がより正確になると感じている。しかし、それは間違いである。小さすぎるトレーニングセットは、ネットワークが入力から汎化されたパターンを学習するのを妨げる。一方、大きすぎるトレーニングセットは、汎化されたパターンが崩壊し、ネットワークが入力ノイズの影響を受けやすくなる。

ニューラルネットワークモデルはしばしば「究極のブラックボックス」と呼ばれる。プローブ解の背後にある説明不足は重大な欠点であり、解の理由や方法を説明できないことがネットワークへの不信を生む。このような問題があるため、一部の業界、特に医療業界ではニューラルネットワークモデルの使用を避けている。

機械学習におけるANNの応用

今日、ニューラルネットワークは、機械学習のパワーを活用し、さまざまな業界の幅広いアプリケーションで使用されている。ビジネスにおけるその使用は、過去数年間で270％の急成長を遂げている。ここでは、ニューラルネットワークが非常に効果的な分野をいくつか紹介する。

1.音声認識:人工ニューラルネットワークは現在、音声認識技術で日常的に使用されている。以前は、隠れマルコフモデルのような統計モデルが音声認識技術に使われていました。

2.画像認識：このアプリケーションは、パターン認識という広いカテゴリーに属する。多くのニューラルネットワークが、文字であれ数字であれ、手書き文字を認識するために開発されてきた。その他、ソーシャルメディアにおける顔認識や衛星画像の処理など、画像認識は急速に拡大している分野である。

3.**テキスト分類：ウェブ検索、情報フィルタリング、言語識別、読みやすさテスト、感情分析など、多くのアプリケーションはテキスト分類に依存している。

4.**ニューラルネットは過去の傾向を調べることによって結果を予測することができる。ニューラルネットワークは、銀行、株式市場、天気予報の分野で日常的に使用されている。この分野ではさらに研究が進んでいる。

5.**ニューラル・ネットワークは、ユーザー行動の分析によく使われている。大量のユーザー生成コンテンツをニューラル・ネットワークで処理し、分析することができる。ユーザーがアプリ内で行うすべてのタップは、洞察に満ちた情報をもたらすことを意味する。そのデータを使って、ユーザーの行動、嗜好、購買行動に基づいてターゲット広告が配信される。

ANN 機械学習の結論

ニューラルネットワークの幅広い関係性を調べる能力により、ユーザーは、理解することが不可能ではないにせよ、そうでなければ困難な現象を素早くモデル化することができる。

ディープ・ニューラル・ネットワークやその他の機械学習モデルによって生成される膨大な埋め込みベクトルを管理することは非常に重要である。これらの高次元データは、従来のデータベースを使用した場合、計算処理が非常に遅くなる。そこで、これらのデータをベクトルデータベースに格納することができる。

これは、ベクトル・データベースの多くの使用例の一つである。ベクトル・データベースとは何だろう？](https://zilliz.com/learn/what-is-vector-database)と疑問に思っている人、そしてそれを探求しようかどうか迷っている人には、まさにZillizの出番だ。

ベクトル・データベースがAIの時代における時代のニーズであることは否定できない。Zillizは、非構造化データを扱う上での課題、特にベクトル類似検索を活用するAI/MLアプリケーションを構築する企業に対して、ワンストップ・ソリューションを提供します。

AIの力を企業に導入したいのであれば、Zillizと連絡を取り、今後の道筋について話し合いましょう！

article.updateAt

Zilliz

読み続けて

Zilliz Cloud Update: Tiered Storage, Business Critical Plan, Cross-Region Backup, and Pricing Changes

This release offers a rebuilt tiered storage with lower costs, a new Business Critical plan for enhanced security, and pricing updates, among other features.

Introducing Zilliz MCP Server: Natural Language Access to Your Vector Database

Developers can easily manage and query vector databases with natural language via Zilliz MCP Server in AI-native environments.

Knowledge Injection in LLMs: Fine-Tuning and RAG

Explore knowledge injection techniques like fine-tuning and RAG. Compare their effectiveness in improving accuracy, knowledge retention, and task performance.