課題設定につきまして
通常は、何かの消費量を予測するために気温を説明変数として用いる、のが一般的かと思いますが
特段の理由があるのでしょうか。
これあれば気温については天気予報を用いて未来を予測する手段がありますが、
ご質問の課題設定ですと、未来を予測するのではなく既知の消費量を用いて気温を予測するということでよろしいでしょうか。
データつきまして
時系列予測の場合一般に時系列データが
- トレンド 大きな上向き傾向、下向き傾向など
- 周期 季節や週など周期的な動き
- 残差 上記では捉えられない残りの動き
に分解され、突発的なイベントなどがあると主に残差に影響してきます。
気温の場合は当然ながら季節性の「周期」が大きな肝になってきます。
ところが説明変数として検討されている
アイスクリーム、おでん、電気 の各消費量は
季節性の「周期」はよいですが、平日、土日祝日の週の「周期」が強く出ます。
ただ、土日だから気温が高い等はないので(都市部では工場や家庭の排熱が影響するかもしれません)
そこが誤差となり、「曜日」「祝日」も説明変数に入れる必要があるかと思います。
分析手法につきまして
トレンドや周期性など時系列の要素を強調するのであれば自己回帰を用いたARIMAなどの時系列モデルも検討の価値があります。そして
SARIMA 季節性を考慮
ARIMAX 自己回帰だけではなく他の説明変数の効果を考慮
さらに両方を兼ね備えた SARIMAX
重回帰分析だけですと自己回帰の部分が考慮できず(n日前の自己の値を説明変数に入れるなどもやろうと思えばできますが複雑になります)
RNNだと365日程度のデータですと「深層」の良さが使えず通常のニューラルネット程度ですので精度があまり出ないと思われます。
精度を追うならばRNNよりも他のアンサンブル学習的な手法を選択するのも手です。
まず、SARIMAX系を試すのがよろしいかと思います。
参考情報
参考としてWeb記事、書籍を挙げておきます。もちろん、またご質問なさっていただければできる限り回答させていただきます。
R系
Python系
この書籍は私は未読なのですがPythonでの時系列分析として評判が良いようです