Chainerで文章分類へ挑戦したいのですが、NStepLSTMへの入力データの形をどうすれば良いかわかりません。
必要な単語ベクトルはあらかじめWord2Vecを使ってそれぞれ200次元のベクトル変数として持っています。
他の方の記事の例などを見ると単語ベクトルではありませんが、
Variable型のリスト[1,2,3,4,5]のようなものを複数渡して
[[1,2,3,4,5],[6,7,8,9,10],.....[95,96,97,98,99,100]]のようなリストになっていました。
これを文章分類で考えるとすると私的にはこの[1,2,3,4,5]というリスト単位が文章に相当して、1や2が単語に相当するのでその部分に200次元の単語ベクトルを格納するということになる。と思っているのですが、これは正しいのでしょうか?
また、話が逸れてしまうのですが、文章分類なので最後の出力だけをソフトマックス関数で出力したいのですが、どのようにして最後の出力だけを取り出すのでしょうか?
最後の出力だけを取り出して、他を無視すると、誤差逆伝播の時にどこの微分変化量を見ているのかがわからなくなりました。
質問がバラバラですが、何か一つでもわかる方がいらっしゃれば教えてください。
よろしくお願いします。
あなたの回答
tips
プレビュー