回答編集履歴
1
修正
answer
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
> 層を増やしたことにより,学習が難しくなっていて,Batch Normalization無しでは学習が全く進みませんでした.
|
4
4
|
|
5
|
-
モデル構造もハイパーパラメータなので、いろいろ試すしかありません。自分で1からモデルを設計するのは大変です。
|
5
|
+
モデル構造もハイパーパラメータなので、いろいろ試すしかありません。自分で1からモデルを設計するのは大変です。また、収束しないときは学習率やバッチサイズも疑ってみてください。オプティマイザが Adam だとうまくいかないのに、SGD だと上手くいくなんてこともざらにあります。
|
6
6
|
|
7
7
|
torchvision で利用できる ResNet などのモデルは、先人が試行錯誤の上、有効であるとわかったモデル構造なので、これを利用すると手っ取り早く高い精度が出るでしょう。
|
8
8
|
|