回答編集履歴
1
追記
test
CHANGED
@@ -1,3 +1,15 @@
|
|
1
1
|
基本的にはReLUです。勾配消失のしようがない。もちろんちょうど0の点で微分できなくなる訳ですが、そもそも計算機でやる時点で離散値で計算してるんですから、工学的にはどうでも良いんです。
|
2
2
|
|
3
3
|
あと、画像で性能が出るようになったのはやはり畳み込みの力でしょうし、「非連続関数関数に基本は向いていない」のをカバーできるくらいたくさんのデータを突っ込んだりして汎化性能を確保できるようになったことも大切ですから、計算機の性能アップも意外と馬鹿にはできません。
|
4
|
+
|
5
|
+
|
6
|
+
|
7
|
+
### 追記
|
8
|
+
|
9
|
+
ちょっと古いですが、こんな解説があってわかりやすかったです。
|
10
|
+
|
11
|
+
[https://www.jstage.jst.go.jp/article/jrsj/33/2/33_33_92/_pdf](https://www.jstage.jst.go.jp/article/jrsj/33/2/33_33_92/_pdf)
|
12
|
+
|
13
|
+
|
14
|
+
|
15
|
+
事前学習(今は廃れた手法だが・・・)と畳み込みで結合が疎になるのが効いている、ということらしいです。
|