結論としては、時系列データであっても、ミニバッチ学習は問題ありません。
質問者様が示したサイトは、画像を扱う例ですので、LSTMの例を探したほうがイメージがつかめると思います。
参考: Kerasで最短(?)LSTM実装
上記のサイトを参照したいただいた前提で説明します。
(ちなみに、このサイトの例では、batch_size = 20
としており、しっかりとミニバッチ学習をしています)
まず、時系列データの学習とは、上記のサイトでの図の青い部分の情報をすべて学習に使い、ピンクの部分を逐次的に予測できるモデルを生成することです。そのため、青い部分の情報を使う順序は問題無く、ランダムにミニバッチが選択されても大丈夫です。一方、学習時点でピンクの部分は知らない前提ですし、推論時でも時系列順にしか知るすべはありません。このピンクの部分を予め知ってしまって学習に組み込むと「リーク」が発生し、正常な学習ができなくなります。
要するに、青い部分を「知ること」については時系列順序は意識する必要はなく、ピンクの部分を「知ること」については時系列順序を意識する必要がある、ということです。なお、これは「知ること」すなわち学習情報として使ってよいかについての話であり、モデルとして時系列を意識した(LSTM型の)ものにしておく話とは別です。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/02 02:33
2021/10/02 03:22 編集
2021/10/02 03:24