質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
XGBoost

XGBoostは、アンサンブル学習と決定木を組み合わせた手法です。弱学習器の構築時に、以前構築された弱学習器の結果を用いて弱学習器を構築。高度な汎化能力を持ち、勾配ブースティングとも呼ばれています。

Kaggle

Kaggleは、機械学習モデルを構築するコンペティションのプラットフォームおよびその運営企業を指します。企業や政府といった組織とデータサイエンティスト・機械学習エンジニアを繋げるプラットフォームであり、単純なマッチングではなくコンペティションが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2075閲覧

GBDT系の目的変数は何を基準に設計すればいいのでしょうか?

kentokawai

総合スコア3

XGBoost

XGBoostは、アンサンブル学習と決定木を組み合わせた手法です。弱学習器の構築時に、以前構築された弱学習器の結果を用いて弱学習器を構築。高度な汎化能力を持ち、勾配ブースティングとも呼ばれています。

Kaggle

Kaggleは、機械学習モデルを構築するコンペティションのプラットフォームおよびその運営企業を指します。企業や政府といった組織とデータサイエンティスト・機械学習エンジニアを繋げるプラットフォームであり、単純なマッチングではなくコンペティションが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2020/05/24 06:35

時系列データの予想コンペで過去のnotebookを見ていたところ、以下のような2通りの予測を行なっていました。

  1. n個先の値を予想するように学習させる
  2. 現在からn個先における変位を予想して、結果を現在の値に加える

例えば 5/20,21,22,23が学習データ、5/24,25,26がテストデータだとして、以下のような具合になります。(わかりづらくすみません。)

1の場合:
n=1のときは、5/20の特徴量で5/21の目的変数を、5/21で5/22をといったように学習、その後5/23を入力して5/24を予想
n=2のときは、5/20の特徴量で5/22の目的変数を、5/21で5/23をといったように学習、その後5/23を入力して5/25を予想

2の場合:
n=1のときは、5/20の特徴量で5/20から5/21の目的変数の差分を、5/21で5/21と5/22の差分をといったように学習、その後5/23を入力して5/23と5/24の差分を予想、この差分を5/23に足し合わせて5/24の目的変数を予想
n=1のときは、5/20の特徴量で5/20から5/22の目的変数の差分を、5/21で5/21と5/23の差分をといったように学習、その後5/23を入力して5/23と5/25の差分を予想、この差分を5/23に足し合わせて5/25の目的変数を予想

これらの使い分けはどのように考えられているのでしょうか?またこのような目的変数や予測するための構造を勉強するためには何を調べれば良いのでしょうか?
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

使い分け

単にどちらが精度が出るか、いろいろ試してみるというだけかと思います。
時系列データの場合は実の値よりも一つ前との差分(階差)を見た方が良い・見ないといけない場合があります。

またこのような目的変数や予測するための構造を勉強するためには何を調べれば

時系列分析という分野を学べば良いと思います。ただ、一般的に時系列分析ですと時系列モデル、状態空間モデルなどの手法を用い、ご質問のような機械学習手法を用いるのは最近のことで書籍などまとまった記述があるものを見たことがありません。ですが、時系列分析を学んだ人ですと機械学習を適用するときにご質問のような発想を自然にすると思います。

投稿2020/06/21 09:55

aokikenichi

総合スコア2240

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kentokawai

2020/06/24 01:53

ご回答ありがとうございます! 時系列分析調べていく中で、利用しているモデルによってどんな差分になることを想定しているのか仮定が違うことなど見つけることができました。 今回のケースでは時系列に従って数値が大きくなり続けるため、差分を予測したほうが正しく予測できそうでした。 ありがとうございました!
aokikenichi

2020/06/24 03:44

お役に立てたようで幸いです 見せかけの回帰、共和分 などをキーワードに調べていくとより理解が深まるかと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問