teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

修正

2020/06/15 11:18

投稿

tiitoi
tiitoi

スコア21960

answer CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  > 層を増やしたことにより,学習が難しくなっていて,Batch Normalization無しでは学習が全く進みませんでした.
4
4
 
5
- モデル構造もハイパーパラメータなので、いろいろ試すしかありません。自分で1からモデルを設計するのは大変です。
5
+ モデル構造もハイパーパラメータなので、いろいろ試すしかありません。自分で1からモデルを設計するのは大変です。また、収束しないときは学習率やバッチサイズも疑ってみてください。オプティマイザが Adam だとうまくいかないのに、SGD だと上手くいくなんてこともざらにあります。
6
6
 
7
7
  torchvision で利用できる ResNet などのモデルは、先人が試行錯誤の上、有効であるとわかったモデル構造なので、これを利用すると手っ取り早く高い精度が出るでしょう。
8
8