#CNNで時系列情報を学習するには
連続した画像系列から姿勢を推定するプログラムを作成しています.
現段階では画像xに対しCNN回帰を用いて姿勢推定したものをf(x)として出力しています.
しかし,連続する動き特徴をより活用するためにネットワークを変更したいと考えています.
例えば,f(x)を推定するときにf(x-1)とxを用いて推定することなどが考えられると思いますがそれはどのように実装可能でしょうか.
またLSTMや3dconvを用いて学習することも可能であると思いますが,これらにどういった違いがあるのか分かりません.
ご教授いただけると幸いです.
あなたの回答
tips
プレビュー