回答編集履歴
2
タイポ
test
CHANGED
@@ -2,4 +2,4 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
ですので、普通は入力train_Xと出力train_Yを小さなまとまり(バッチ、と呼ばれます)に分割して、小さなステップでNNを最適化します。これは確率的
|
5
|
+
ですので、普通は入力train_Xと出力train_Yを小さなまとまり(バッチ、と呼ばれます)に分割して、小さなステップでNNを最適化します。これは確率的勾配法と呼ばれます。その場合は例えばmkgreiさんが提示してくれたコードのようにfeed_dictに食わせるデータを変えながらsess.runを呼び出して行きますよ。
|
1
追記
test
CHANGED
@@ -1 +1,5 @@
|
|
1
|
-
意味があるかどうかは目的次第かと思います。例えd_train[[0,1,2,3,4,5,6]]を使ってd_train[[7]]だけにfitさせたいと言うであれば、載せていただいたコードはその目的にかなっています。ただ、こ
|
1
|
+
意味があるかどうかは目的次第かと思います。例えd_train[[0,1,2,3,4,5,6]]を使ってd_train[[7]]だけにfitさせたいと言うであれば、載せていただいたコードはその目的にかなっています。ただ、これだと(仮にどりたも複数のデータセットだとしても)全てのデータを計算してから重みが一回だけ更新されるので、学習効率が悪いことが知られています。
|
2
|
+
|
3
|
+
|
4
|
+
|
5
|
+
ですので、普通は入力train_Xと出力train_Yを小さなまとまり(バッチ、と呼ばれます)に分割して、小さなステップでNNを最適化します。これは確率的購買法と呼ばれます。その場合は例えばmkgreiさんが提示してくれたコードのようにfeed_dictに食わせるデータを変えながらsess.runを呼び出して行きますよ。
|