ミニバッチ学習におけるパラメータ更新について

Pytorchを使って，ミニバッチ学習を用いたCNNモデルを構築しています．その際に，パラメータ更新をミニバッチごとのlossの平均値で行っているのですが，これは正しい実装なのでしょうか．
コードとしての実装は以下の通りになっています．

python
1for count, data in enumerate(self.train_loader):
2    inputs = Variable(data['inputs'])
3    labels = Variable(data['labels'])
4    batch_loss = []
5    #batch_size = 32なので，32回ループしてlossの平均を取る    
6    for i, l in zip(inputs, labels):
7        out = model(i)
8        loss = self.criterion(out, l)
9        batch_loss.append(loss)
10    batch_ave_loss = sum(batch_loss)/len(batch_loss)
11    self.optim.zero_grad()
12    batch_ave_loss.backward()
13    self.optim.step()

ミニバッチ学習が，バッチ毎のlossの平均でパラメータ変更を行うということは色々な記事でみたのですが，実際に上記のコードでのfor文のようなコードを書いている人はいませんでした．
これはネットワークの構造によるものなのでしょうか．

行動規範の内容に同意します

回答1件

ベストアンサー

DataLoader がバッチサイズ個のミニバッチを返すようになっているので、バッチサイズ=32の場合に中で32回ループを回す必要はありません。
バッチサイズの数は DataLoader のコンストラクタ引数で指定できます。

for inputs, labels in dataloader:
    # inputs に対して推論

    # 推論結果と labels で損失計算


    # パラメータ更新

    # 以上で1回分の学習完了 これがミニバッチ学習

ループの中では DataLoader が返した inputs に対して推論を行い、推論結果と labels を使って誤差を計算して、一度だけパラメータ更新を行えばよいです。

参考

学習ループ部分の参考コード

DataLoader のバッチサイズ指定について

投稿2021/01/30 10:33

編集2021/01/30 10:34

tiitoi

総合スコア21956

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

ミニバッチ学習におけるパラメータ更新について

関連した質問