IoT, AI,機械学習 トピックス

特徴とぼかし

投稿日:

複雑なニューラルネットワークを処理するディープラーニングにおいて、計算の効率化を支援する手法が「畳み込み」と「プーリング」です。

資料はこちら → 機械学習概論4

p.1 ニューラルネットワークの中に畳み込みとプーリングを複数設置して出力します。畳み込みで入力データの特徴量を強調させ、プーリングでは代表値にまとめることで、データ量を削減します。「ぼかし」には、位置情報を許容する役目もあります。

p.2 畳み込みとプーリングを事例で説明しているサイトは幾つもありますが、わかりやすいサイトから2つ程転用させていただきます。左が畳み込みの説明図です。雪の結晶画像をピクセル等の数値のマトリクスとします。 これを読み込む際に、フィルタの数値を掛けて加算した値をマトリクス化します。このマトリクスが特徴マップと呼ばれています。プーリングはこの情報の平均値あるいは最大値代表値として、データ量を削減することができます。

p.3 畳み込みの際の、フィルタに特徴の一部を用いることがあります、〇×のデータがある場合、×の中心部のマトリクスをカーネル(フィルタ)として、認識した画像データにずらして演算していきます。

p.4 数値は、スカラ→ベクトル→マトリクス→テンソルのようにデータ量が多くなっていきます。ディープラーニングでは非常に多くのテンソルを用いますので、適したソフトやライブラリが必要です。下表にライブラリをまとめました。TensorFlowについては、以前の「識別に利用できるライブラリ」「機械学習やpythonが簡単に使えるドライブ」をご参照ください。

顔や文字認証画像処理いたるところでディープラーニングが実施されています。人間の脳にどこまで迫ることができるのでしょうか? それとも超えてしまうのか?

-IoT, AI,機械学習, トピックス

Copyright© 進化するガラクタ , 2024 All Rights Reserved Powered by STINGER.