これまで,CNNのモデルを学習させるときにはoptimizerのみzero_gradを使うものだと思っていました.
しかしpytorch公式のチュートリアルのDCGANでは,定義したネットワークモデル対してzero_gradを用いており,optimizerには用いていませんでした.
モデルへのzero_gradはどのような効果があるのでしょうか?
また,このチュートリアルでoptimizerにzero_gradを使用していないのは何故でしょうか?
ご存知の方おりましたら回答いただければ幸いです.
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。