回答編集履歴

微修正

2019/10/29 23:14

投稿

quickquip

スコア11314

answer CHANGED Viewed

@@ -5,10 +5,10 @@
 ----
 (追記)
-質問に貼ってあるソースの動きは。
+質問に貼ってあるソースの動きはこうです。
 1層目のLSTMの時刻t0の入力x0は「画像の一番上の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
-LSTMにx0を入れると内部状態を更新してh0になります。
+LSTMにx0を入れると内部状態(128次元ベクトル)を更新してh0になります。（と同時にこれが出力でもあります。後述）
 1層目のLSTMの時刻t1の入力x1は「画像の上から2番目の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
 LSTMは1つ前の内部状態h0と、x1から、内部状態を更新してh1になります。
@@ -20,7 +20,7 @@
 `return_sequences=True`が指定してありますから、1層目のLSTMの出力は、h0からh27の128次元のベクトル28個をconcatenateしたものです。
-2層目のLSTMの入力は128次元のベクトルの28ステップの時系列データとなります。
+したがって、2層目のLSTMの入力は128次元のベクトルの28ステップの時系列データとなります。
 ----
@@ -37,7 +37,7 @@
 `return_sequences=True`が指定してありますから、2層目のLSTMの出力は、h0からh27の128次元のベクトル28個をconcatenateしたものです。
-3層目のLSTMの入力も2層目と同様、128次元のベクトルの28ステップの時系列データとなります。
+したがって、3層目のLSTMの入力も2層目と同様、128次元のベクトルの28ステップの時系列データとなります。
 ----
@@ -49,6 +49,8 @@
 `return_sequences=False`が指定してありますから、3層目のLSTMの出力は、**最後の**内部状態ベクトルh27です。つまり128次元のベクトルを出力します。
+したがって、最後の全結合層の入力は128次元のベクトルになります。
 ----
 最後に、128次元の入力から全結合層につながって、10次元のベクトルをsoftmax関数を通して出力することでクラス分類の結果としています。

些細

2019/10/29 23:14

投稿

quickquip

スコア11314

answer CHANGED Viewed

@@ -5,6 +5,8 @@
 ----
 (追記)
+質問に貼ってあるソースの動きは。
 1層目のLSTMの時刻t0の入力x0は「画像の一番上の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
 LSTMにx0を入れると内部状態を更新してh0になります。

追記

2019/10/29 23:09

投稿

quickquip

スコア11314

answer CHANGED Viewed

@@ -1,3 +1,52 @@
 「28次元のベクトル」が変化していく時系列データを「28ステップ分」記録したもの
-だと思ってLSTMは処理しています。
+だと思ってLSTMは処理しています。
+----
+(追記)
+1層目のLSTMの時刻t0の入力x0は「画像の一番上の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
+LSTMにx0を入れると内部状態を更新してh0になります。
+1層目のLSTMの時刻t1の入力x1は「画像の上から2番目の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
+LSTMは1つ前の内部状態h0と、x1から、内部状態を更新してh1になります。
+(略)
+1層目のLSTMの時刻t27の入力x27は「画像の一番下の28ピクセル」に対応する「28個の数値」を、28次元のベクトルだと見たものです。
+LSTMは1つ前の内部状態h26と、x27から、内部状態を更新してh27になります。
+`return_sequences=True`が指定してありますから、1層目のLSTMの出力は、h0からh27の128次元のベクトル28個をconcatenateしたものです。
+2層目のLSTMの入力は128次元のベクトルの28ステップの時系列データとなります。
+----
+2層目のLSTMの時刻t0の入力x0は「1層目のLSTMの時刻0の内部状態ベクトル」です。
+LSTMにx0を入れると内部状態を更新してh0になります。
+2層目のLSTMの時刻t1の入力x1は「1層目のLSTMの時刻1の内部状態ベクトル」です。
+LSTMは1つ前の内部状態h0と、x1から、内部状態を更新してh1になります。
+(略)
+2層目のLSTMの時刻t27の入力x27は「1層目のLSTMの時刻27の内部状態ベクトル」です。
+LSTMは1つ前の内部状態h26と、x27から、内部状態を更新してh27になります。
+`return_sequences=True`が指定してありますから、2層目のLSTMの出力は、h0からh27の128次元のベクトル28個をconcatenateしたものです。
+3層目のLSTMの入力も2層目と同様、128次元のベクトルの28ステップの時系列データとなります。
+----
+3層目のLSTMの時刻t0の入力x0は「2層目のLSTMの時刻0の内部状態ベクトル」です。
+LSTMにx0を入れると内部状態を更新してh0になります。
+(略)
+3層目のLSTMの時刻t27の入力x27は「2層目のLSTMの時刻27の内部状態ベクトル」です。
+LSTMは1つ前の内部状態h26と、x27から、内部状態を更新してh27になります。
+`return_sequences=False`が指定してありますから、3層目のLSTMの出力は、**最後の**内部状態ベクトルh27です。つまり128次元のベクトルを出力します。
+----
+最後に、128次元の入力から全結合層につながって、10次元のベクトルをsoftmax関数を通して出力することでクラス分類の結果としています。