質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

1回答

3161閲覧

多変量の説明変数(時系列)から異なる時系列を予測する方法

pypypy.bom

総合スコア31

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2020/06/11 06:29

編集2022/01/12 10:55

##知りたいこと

例えば、

東京の
①アイスクリームの365日間分の1日消費量(時系列データ)
②おでんの365日間分の1日消費量(時系列データ)
③電気の365日間分の1日消費量(時系列データ)
などから

*東京の365日間分の1日の平均気温(時系列データ)
(1月1日の平均気温は10℃
1月2日の平均気温は11℃
1月3日の平均気温は9℃ … のような形で)

を予測したい。

##考えてみたこと
①線形回帰問題として→重回帰分析などを用いること
(上記問題ならy(4/3)=aIce(4/3)+bOden(4/3)+c*Ele(4/3)+d のような使い方)
【メリット】シンプルなモデルで実現可能
【問題点】時系列予測にはあまり適していないという文献も見られる

②深層学習に頼って→RNNなどを用いること
【メリット】時系列の予測に適している
【問題点】モデルが複雑になる。技術先行で説明力が低くなる恐れがある。

##コメント
訂正等できるだけ早く対応します。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kyoya0819

2020/06/11 06:37

知りたいのは分析方法等でしょうか? それともまた別でしょうか?
pypypy.bom

2020/06/11 06:43

第一に予測方法です。 その中である程度の説明力を持たせることができるものがベストと考えております。 ただ、最大目的は予測の部分であるので説明力に関しては必ずしも必須ではないです。
guest

回答1

0

課題設定につきまして

通常は、何かの消費量を予測するために気温を説明変数として用いる、のが一般的かと思いますが
特段の理由があるのでしょうか。
これあれば気温については天気予報を用いて未来を予測する手段がありますが、

ご質問の課題設定ですと、未来を予測するのではなく既知の消費量を用いて気温を予測するということでよろしいでしょうか。

データつきまして 

時系列予測の場合一般に時系列データが

  • トレンド 大きな上向き傾向、下向き傾向など
  • 周期   季節や週など周期的な動き
  • 残差   上記では捉えられない残りの動き

に分解され、突発的なイベントなどがあると主に残差に影響してきます。

気温の場合は当然ながら季節性の「周期」が大きな肝になってきます。

ところが説明変数として検討されている
アイスクリーム、おでん、電気 の各消費量は
季節性の「周期」はよいですが、平日、土日祝日の週の「周期」が強く出ます。
ただ、土日だから気温が高い等はないので(都市部では工場や家庭の排熱が影響するかもしれません)
そこが誤差となり、「曜日」「祝日」も説明変数に入れる必要があるかと思います。

分析手法につきまして

トレンドや周期性など時系列の要素を強調するのであれば自己回帰を用いたARIMAなどの時系列モデルも検討の価値があります。そして
SARIMA 季節性を考慮
ARIMAX 自己回帰だけではなく他の説明変数の効果を考慮
さらに両方を兼ね備えた SARIMAX

重回帰分析だけですと自己回帰の部分が考慮できず(n日前の自己の値を説明変数に入れるなどもやろうと思えばできますが複雑になります)
RNNだと365日程度のデータですと「深層」の良さが使えず通常のニューラルネット程度ですので精度があまり出ないと思われます。
精度を追うならばRNNよりも他のアンサンブル学習的な手法を選択するのも手です。

まず、SARIMAX系を試すのがよろしいかと思います。

参考情報

参考としてWeb記事、書籍を挙げておきます。もちろん、またご質問なさっていただければできる限り回答させていただきます。

R系

Python系

  この書籍は私は未読なのですがPythonでの時系列分析として評判が良いようです

投稿2020/06/20 03:57

aokikenichi

総合スコア2210

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pypypy.bom

2020/06/20 05:05

丁寧なご回答ありがとうございます。 予測の問題設定は仰る通りです。既知の値を用いて予測する設定になります。 まだ認識が甘いのですが、 ARIMAXといった自己回帰モデルは、予測したい目的変数を自己回帰する(+その他の説明変数も考慮しながら)モデルだと思うのですが、このようなモデルは初期値に目的変数を一切用いずに予測を進めていくことは可能なのでしょうか?
aokikenichi

2020/06/20 07:29

すみません「初期値」というのが何を指すのかわかりません。 また「初期値に目的変数を一切用いずに予測を進めていく」というのがわかりません。 教師なし学習をしたいとのことでしょうか。 重回帰でもRNNでも教師ありでないとこの課題は解けないと思います。 自己回帰モデルは自分自身の値の過去のパターンをモデル化しますので、目的変数である自分の値をフル活用します。 それとも冒頭の課題設定の私の理解が誤っているでしょうか。 以下のようにyを目的変数としてxを説明変数とします。 当然ながら現在までの価を既知として未来の価は未知とします。 過去    現在   未来 ..., y_n-2, y_n-1, y_n y_n+1, y_n+2, ... ..., x_n-2, x_n-1, x_n, x_n+1, y_n+2, ... (以下説明変数は複数) で、 y_n+1, y_n+2, ... を求めたいのだと思います。 ・明日になり、x_n+1に該当する価は得られた場合にy_n+1を知りたいということでしょうか。 この場合 消費量は分かってるが気温が分からないので知りたい という課題設定となり現実的に ありえない設定かと(温度計もってこいよなので)思いますが ・今日の時点でx_n+1を予測しつつ、y_n+1も予測したいとのことでしょうか。 これだと重回帰のみでは不可能かと思います。 ・時系列分析の自己回帰のみでxを用いずにy_n+1を予測するといのもあり得ますが  冒頭の課題設定からxを用いるとのことですのでこれはなし の3パターンかなと思いますがどれにあたりますでしょうか。どれも理解し辛い解釈なのですが。
pypypy.bom

2020/06/20 11:21

丁寧なご回答ありがとうございます。 私の説明に不備がありました。 私が例題としてあげた内容は、気温が目的変数になっていますから当然過去のデータは既知であるということになります。したがって、過去の周期性を利用することができると思いますし、するべきであると思います。 しかし、実際に私が予測したいデータは気温のように過去のデータがそもそも存在していないものになります。(データの内容は諸事情により伏せさせていただきます。) 従って、以下のような例の方が適切であったかもしれません ある人が100mを走ります。このときのスタートからゴールまでの時々刻々の ・走行速度 ・関節の角度(複数) を説明変数とし 時々刻々の ・酸素の消費量 を予測するようなケース。 この場合、モデルを作るためにはモデルデータとして実験室で説明変数と目的変数を計測することができます。 しかし、実際にこのモデルの利用は呼気ガスを測定できないような状況(グラウンドなど)を想定しています。従って、実際に予測したいデータは目的変数が計測できておらず、その代わりに説明変数のみ計測ができている状況です。 このような場合でも自己回帰モデルの適応は可能でしょうか? 理解が甘く、説明も拙くなってしまい大変申し訳ありません。
pypypy.bom

2020/06/20 11:22

ご質問にご回答する形での返答ではないのですが、こちらの方が誤解を解くことができるのではないかと回答させていただきました。ご検討いただけると幸いです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問