質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

パラメータ

関数やプログラム実行時に与える設定値をパラメータと呼びます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

h2o

H2Oは、ビッグデータを用いて機械学習や予測分析を行うオープンソースのソフトウェアです。in-memoryプラットフォームとして、Hadoop・Spark上で動作するのを前提に配布されています。

Q&A

0回答

939閲覧

R言語 H2o AutoMLのパラメタに特徴を持たせる工夫について

iso999

総合スコア0

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

パラメータ

関数やプログラム実行時に与える設定値をパラメータと呼びます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

h2o

H2Oは、ビッグデータを用いて機械学習や予測分析を行うオープンソースのソフトウェアです。in-memoryプラットフォームとして、Hadoop・Spark上で動作するのを前提に配布されています。

0グッド

0クリップ

投稿2021/10/19 13:22

編集2022/01/12 10:55

機械学習の特徴が出なくて困っています

株価リアルタイム予測を行うモデルで1分毎に集約したデータをモデルに渡して5分後に上がる場合は1、そうでない場合は0を予想するモデルです。
トレーニングデータには現在値と比較割合を算出したり人間が判断して影響がありそうなデータはfactorにして特徴を出そうとしてトレーニングデータに渡しています
機械学習のライブラリはH2oを使用でnfoldsは5を設定し交差検定させています。

発生している問題

AUCが9割近く出るのですが実際のデータを渡すと全くのでたらめな結果となります。恐らくトレーニングデータの前後のレコードをテストデータとして使用している為、あたかも予想できたように振舞うのだと思い、fold_columnを設定すると予想通り全くAUCが6割で全く予想できていないことが判明しました。

該当のソースコード

使用するレコードの一部
現在値、高値、安値、5分足、25分足、50分足、出来高、VWAP、・・・その他200項目程

automl_models_h2o <- h2o.automl(
x = x,
y = y,
training_frame = train_h2o,
balance_classes = TRUE,
max_runtime_secs = 0,
nfolds = 5,
fold_column = "Day",
exclude_algos = c("DeepLearning","XGBoost"),
seed = 123
)

試したこと

・fold_column を変更
・時系列情報を5分遡って横展開して現在値と比較
・色々な組み合わせでfactorを作成

知りたい内容

パラメタ単体をグラフで確認しても人間の目では特徴が出ているようには見えない。
どうすれば特徴を出すことが出来るかが知りたい。例えば下記のようなことが出来るか。
・時系列データ横展開部分をAutoMLに時系列データとして渡すことは可能か。もしはロジスティック回帰のモデルを別に作成して予想結果した結果をAutoMLに渡すパラメタに含める工夫が必要か。
・必要なパラメタ、不要なパラメタをどのように判断すればよいか。上記したようにパラメタ単体で見ると特徴が見えにくい。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問