CNNにおいて、特徴量検出のための"フィルタ"と呼ばれるものがあると思います。Kerasだと
python3
1Conv2d(32,(3,3))
とすれば3*3のサイズを持った32個のフィルタを用意できて、そのフィルタの値を更新していくことが学習になると思います。
ここで質問が4つあります。
-
Conv層からの出力の数はフィルタ数と一致すると思いますが、このとき次の層に入力されるのは"元の画像にフィルタをかけたあとの特徴量マップ*フィルタ数"分のデータという認識で正しいでしょうか?
-
この畳み込みの際に、32個のフィルタを用いるなら32種類に対し毎回毎回画像の畳込みを行って特徴量マップを作っているということでよろしいでしょうか?
-
畳み込みの処理を考えてみると、この層においてはやはり"フィルタの数値(3*3フィルタなら9つの数値)"が"重み"としての情報を持つのでしょうか?
-
全結合層においてはたくさんのニューロンがさながら"投票"のように各ラベルに信号を送り、最も大きな信号を受け取ったラベルがCNNの予測結果となりますが、このとき"あるラベルXに対してよく反応する1つめの全結合層のニューロン"から浅い層へ戻っていくと"ラベルXに分類されるものの特徴をよく表すフィルタがかかった特徴量マップ"に辿り着くのでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/02/09 00:58
2019/02/09 01:48
2019/02/09 03:11
2019/02/09 07:38 編集
2019/02/09 07:37 編集
2019/02/09 11:45