回答編集履歴

補足2

2017/10/11 22:19

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

@@ -132,7 +132,7 @@
-一方プーリングは、フィルタはなく、機械的に代表値をピックアップしていく処理です。データが小さくなるメリットと、多少ズレてもズレを代表値をピックアップする中で潰していけますよね。
+一方プーリングは、フィルタはなく、機械的に代表値をピックアップしていく処理です。代表値をピックアップする中、画像が大幅に小さくなる＝計算量が小さくなるメリットと、多少対象物が左右上下にズレてもズレを吸収できるメリットがありますね。
@@ -140,7 +140,7 @@
-**線形分離問題、パーセプトロン**、がキーワードです。一つ言えることは、CNNの初期段階では細かいエッジを、後半では何か本質的なものを評価します。例えば、浅い層では「斜めの線」が、深い層では「犬」のような感じです。
+一つ言えることは、CNNの初期段階では細かいエッジを、後半では何か本質的なものを評価します。例えば、浅い層では「斜めの線」が、深い層では「犬」のような感じです。ただのエッジを本質的なものに変換しやすくなるとでもいうのでしょうか。線形分離しかできないパーセプトロンをたくさん重ねることで表現力が上がり、非線形分離できるようになります。層を増やすことはエクセルの散布図でいう近似曲線の次元数を増やすことと同じイメージです。次元が多いほど最適化されていきますが、ムダにグニャグニャして無理にフィッティングしているためデータのないところは大きく外れます。これが過学習と同じ現象です。これをデータ数やドロップアウトなどで抑えているような感じです。**線形分離問題、パーセプトロン**、がキーワードです。
@@ -148,4 +148,4 @@
-畳み込み、プーリングの実体ですね。私の理解での説明ですが、これらを読んで調べて、それでも分からない部分を改めて別の質問で上げるべきだと私は思います。
+畳み込み、プーリングの実体ですね。ここまでは私の理解での説明ですが、これらを読んで調べて、もう一度interfaceの部分を眺めて、それでも分からない部分を改めてピンポイントに別の質問で上げるべきだと、私は思います。

誤植修正

2017/10/11 22:19

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

@@ -122,9 +122,11 @@
 ---
-**10/12 1:30追補**
+**10/12 1:50追補**
 > 畳み込み，プーリングの意味がいまいち分かりません
 畳み込みは、フィルタ（カーネル）をスライドさせながら特徴を抽出していく処理です。最近CNNでよく出てきますが、なんちゃってラプラス変換だとかあれやこれやと古くからある処理です。**本質的に畳み込み処理はエッジ検出機**とみてよいと思います。通常のエッジ検出では使わないフィルタを使うことで、物体の細かい違いを表現できる、とでもいうのでしょうか。[このへん](http://hokuts.com/2016/12/13/cnn1/)が参考になると思います。

追補

2017/10/11 22:06

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

@@ -117,3 +117,33 @@
 畳み込みやプーリングがいまいちわからない、という場合には、[3Dに可視化したもの](http://scs.ryerson.ca/~aharley/vis/conv/)をみるとイメージがつかみやすいのではないでしょうか。
+---
+**10/12 1:30追補**
+> 畳み込み，プーリングの意味がいまいち分かりません
+畳み込みは、フィルタ（カーネル）をスライドさせながら特徴を抽出していく処理です。最近CNNでよく出てきますが、なんちゃってラプラス変換だとかあれやこれやと古くからある処理です。**本質的に畳み込み処理はエッジ検出機**とみてよいと思います。通常のエッジ検出では使わないフィルタを使うことで、物体の細かい違いを表現できる、とでもいうのでしょうか。[このへん](http://hokuts.com/2016/12/13/cnn1/)が参考になると思います。
+一方プーリングは、フィルタはなく、機械的に代表値をピックアップしていく処理です。データが小さくなるメリットと、多少ズレてもズレを代表値をピックアップする中で潰していけますよね。
+> なぜ層を重ねると精度が上がるのか分かりません
+**線形分離問題、パーセプトロン**、がキーワードです。一つ言えることは、CNNの初期段階では細かいエッジを、後半では何か本質的なものを評価します。例えば、浅い層では「斜めの線」が、深い層では「犬」のような感じです。
+> interfaceの部分が具体的にどのような処理をしているのか
+畳み込み、プーリングの実体ですね。私の理解での説明ですが、これらを読んで調べて、それでも分からない部分を改めて別の質問で上げるべきだと私は思います。