質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

1105閲覧

先行指標を見つけるのに適したライブラリ

退会済みユーザー

退会済みユーザー

総合スコア0

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

3クリップ

投稿2020/06/17 13:10

編集2020/06/19 12:10

前提・実現したいこと

「複数のデータが特定の条件を満たした場合、対象が1週間後に上昇している確率が70%であった」というような先行指標を見つけるために、過去のデータを分析しています。

例)
対象:大豆先物価格
データ:生産地の気象・消費国の輸入量・外食企業の売上・冷蔵車製造企業の業績など

複数のデータを組み合わせて、先行指標を探し出すのに適したPythonライブラリ等をご存知でしたらお教え下さい。

発生している問題・エラーメッセージ

Excelでパラメータ2つの売買シミュレータを作成しましたが、パラメータ3つ以上は組み合わせが多すぎて、適切なポイントを見つけることが困難です。

よって、Pythonでのデータ分析に移行しようと思い、いくつかのライブラリ等を勉強しましたが、課題を解決できるものではありませんでした。

試したこと

重回帰分析や多変量解析などの統計手法をPythonで記述する方法と、Chainerの学習をしました。
しかし、これらでは「複数のデータを組み合わせて、先行指標を探す」ことが出来ないことが分かりました。

補足情報

・PythonによるWebスクレイピングを学習中のため、データ収集については、この質問では伺いません。
・プログラミング初心者のため、課題を解決する手段が誤っている場合(そもそもPythonでは実現できないなど)場合は、ご指摘頂ければ幸いです。
・株価や先物価格は、あくまで投資家の様々な思惑で上下するため、データとの間に直接的な因果関係があるとは限りません。
・どのデータの組み合わせが先行指標となっているか、また、それがどの程度の時差があるのかが不明です。それを解き明かすことの出来るライブラリ等をお教えください。

お忙しいところ、恐縮ですが、どうぞよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

大豆先物価格が例示されてますので、金融や商品の市況予測での先行指標を探されたいとのことでよろしいでしょうか。
可能性は否定しませんが、極めて困難と思われます。
膨大な研究がありますが、公にされている有意なものはほぼないと思われます(実は見つけていてこっそり稼いでいるはあり得ますが)。
もしPythonのライブラリで容易に見つけられるようなものならば、すでにどなたかがその先行指標を発見して先回りして売買してしまうので、その先行性は薄まるか消えてしまうでしょう。
本気で必要に迫られているのであれば時系列分析についてがっつり学ぶしかないと思います。

ただ、学習の一環として取り組まれるとのことであれば時系列データの特性を体感するために有意義だと思います。

先行指標となっているか、また、それがどの程度の時差があるのかが不明

「先行指標」の定義をどうするかがかなり肝かと思います
「複数のデータが特定の条件を満たした場合、対象が1週間後に上昇している確率が70%であった」
のままだと探しようがないので、まずは相関係数からでしょうか。そうすると時系列データですと「見せ掛けの回帰」の問題にぶつかりますので、それを調べて解消していくと時系列データの知見が貯まると思います。
「その程度の時差」については単に
大豆先物価格のリスト
各説明変数のリスト
を作成し、1つずつスライドさせてどのスライドが「先行指標」に適しているかを見ていくことになるかと
思います。

投稿2020/06/20 08:17

aokikenichi

総合スコア2218

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2020/06/22 12:41

>1つずつスライドさせて・・・ エクセルでそのようにしていましたが、プログラミングならもっと効率よく数行のコードで出来るものだと、幻想を抱いていました。 皆さんの回答を拝見し、「非常に困難」という結論に至りました。 ありがとうございました。
guest

0

キーワードとしては、「データマイニング」ですかね。
古いですが、それっぽいことをpythonスクリプトでされている方の記事。
https://qiita.com/ynakayama/items/420ebe206e34f9941e51

投稿2020/06/17 16:12

patapi

総合スコア749

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2020/06/22 12:39

ありがとうございます。
guest

0

データ収集と分析の2つの大きな壁がありますね。
データ収集は検索ロボット、分析はAIというキーワードになるかと思いますが、やられたいことはプチ・ラプラスの悪魔って感じで、実現できれば凄い事だと思います。

投稿2020/06/17 13:25

sazi

総合スコア25206

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2020/06/22 12:39

ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問