#やりたいこと
時系列データを以下の図のように訓練データとテストデータを分割したいと考えています.
スライド期間は1個ずつなど, このようなことが出来るライブラリなど, あるいはコード, 参考になるwebサイト等ございましたら教えてください.
参考元url (https://pimientito-handson-ml.hatenablog.com/entry/2019/07/15/000955)
#調べたこと
時系列データの分析ということでTimeSeriesSplitについて調べました.
VAR, LSTM を使用した分析をしたいと思っているのですが, 学習に使うデータの量は一定で行いたいと思っているのでこれは当てはまらないかと考えております.
#追記: 問題設定
全部で500秒分のデータがあります. そこに訓練データは100秒固定でテストを1-100秒の予測を行います. 1秒先の予測誤差RMSEから100秒先まで
行い, これを一回の試行とします.
これを一回目は1-100秒のデータで, 2回目は2-101秒のデータ...と400回行います. [1-100のRMSE]の配列を400個用意し, 全体のデータに対して各手法のn秒後の予測精度として平均のRMSEはどれくらいかということを調べたいと思っております. 例えば1秒先をLSTMで学習データ100個で予測すると平均してRMSEが〇〇で予測できる, といったことを調べたいのです. そして最終的には各手法を予測時間とRMSEのグラフにして, n秒後以降を予測するならばこちらの手法の方が優れている, といったようなことを知りたいと思っております.
あなたの回答
tips
プレビュー