質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

1回答

1776閲覧

機械学習(ランダムフォレスト)による目的変数の変換について

kouji_39

総合スコア164

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2020/04/12 05:05

機械学習(ランダムフォレスト)による目的変数の変換について

現在、ランダムフォレストで回帰予測を実施しています。
目的変数yを逆変換(1/y)および自然対数変換(log(y)、底はe)で、
ランダムフォレストで回帰予測精度を向上できた方はいますでしょうか。
応用数学に詳しい方から、上記の目的変換で、回帰予測が向上するのでは
という助言をいただき、実施したのですが、逆に予測精度(mseで評価)は
下がりました。私の予測対象は、ランダムでかつ周期的な波の形状となるもの
であり、そのピークの波の高くなる部分が、低く予測される状態です。それで
助言してくれた方は、一度、目的変数yを小さくすることで、その波のピーク
をうまく予測するのではという発想ではないかと思います。私の、予測精度
が下がった理由としては、ランダムフォレストが回帰木の集合で、かつノン
パラメトリックなものなので、線形、多項式、重回帰のタイプのパラメトリック
タイプの予測モデルと異なる(つまりy軸とかの数字の大小に左右されない)、
ことより、予測精度が向上しなかったという仮説を立てました。この点について、
詳しい方のご助言をいただけら幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

ランダムフォレストを使われているならば目的変数の変換よりも、説明変数の見直しの方が良いかと思います。
予測値と実測値の差についてのグラフは見られましたでしょうか。周期性か何かパターンがあるでしょうか。
それを説明する変数が何かあるのでは無いかと思います。

投稿2020/06/21 05:40

aokikenichi

総合スコア2218

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kouji_39

2020/07/03 11:44

aokikenichi様、アンサーありがとうございます。ランダムフォレストの場合、目的変数のスケールをいじっても効果が出ないというのが私の実感です。そして、説明変数(特徴量)の選択や加工が、ランダムフォレストモデルの予測精度を向上させる一番の策と考えています。意見が合って良かったです。 今後ともよろしくお願いいたします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問