質問編集履歴
3
誤字
test
CHANGED
File without changes
|
test
CHANGED
@@ -52,7 +52,7 @@
|
|
52
52
|
|
53
53
|
・株価や先物価格は、あくまで投資家の様々な思惑で上下するため、データとの間に直接的な因果関係があるとは限りません。
|
54
54
|
|
55
|
-
・どのデータの組み合わせが先行指標となっているか、また、それがどの程度の時差があるのかが不明です。それを解き明かすことの出来るライブラリをお教えください。
|
55
|
+
・どのデータの組み合わせが先行指標となっているか、また、それがどの程度の時差があるのかが不明です。それを解き明かすことの出来るライブラリ等をお教えください。
|
56
56
|
|
57
57
|
|
58
58
|
|
2
質問の明確化
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
先行指標を見つけるのに適したライブラリ
|
test
CHANGED
@@ -2,27 +2,19 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
|
5
|
+
「複数のデータが特定の条件を満たした場合、対象が1週間後に上昇している確率が70%であった」というような先行指標を見つけるために、過去のデータを分析しています。
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
+
例)
|
10
|
+
|
11
|
+
対象:大豆先物価格
|
12
|
+
|
9
|
-
|
13
|
+
データ:生産地の気象・消費国の輸入量・外食企業の売上・冷蔵車製造企業の業績など
|
10
14
|
|
11
15
|
|
12
16
|
|
13
|
-
そこで、様々なデータを分析し、例えば「中国の外食企業A社の既存店売上高が前年度比+3%以上、米国アイオワ州の過去1周間の最高気温の合計が○○度以下、ブラジルのゴイアス州の降水量が過去1ヶ月合計で○○mm以下という3つの条件が揃うと、過去10年間に80%の確率で価格が上昇している」という結果を発見できれば、その条件が揃った時に大豆先物を買建てしたいです。
|
14
|
-
|
15
|
-
(実際の売買では、鞘や金利も考慮する必要がありますし、そんなに単純ではありません。)
|
16
|
-
|
17
|
-
|
18
|
-
|
19
|
-
|
17
|
+
複数のデータを組み合わせて、先行指標を探し出すのに適したPythonライブラリ等をご存知でしたらお教え下さい。
|
20
|
-
|
21
|
-
|
22
|
-
|
23
|
-
目標を実現するためには、何を学べばいいのかアドバイスを頂ければ幸いです。
|
24
|
-
|
25
|
-
(言語やライブラリなど)
|
26
18
|
|
27
19
|
|
28
20
|
|
@@ -30,15 +22,11 @@
|
|
30
22
|
|
31
23
|
|
32
24
|
|
33
|
-
E
|
25
|
+
Excelでパラメータ2つの売買シミュレータを作成しましたが、パラメータ3つ以上は組み合わせが多すぎて、適切なポイントを見つけることが困難です。
|
34
|
-
|
35
|
-
その結果、先物価格等のデータを15年以上を取り込み、年率20%以上の売買シグナルを見つけましたが、DD率(最大損失率)が非常に高く、実用には向きませんでした。
|
36
|
-
|
37
|
-
取引1回あたりの損益率の散布図を見て、損失を出した取引を減らせないかパラメータを動かしたりしましたが、いい結果は得られませんでした。
|
38
26
|
|
39
27
|
|
40
28
|
|
41
|
-
|
29
|
+
よって、Pythonでのデータ分析に移行しようと思い、いくつかのライブラリ等を勉強しましたが、課題を解決できるものではありませんでした。
|
42
30
|
|
43
31
|
|
44
32
|
|
@@ -48,21 +36,9 @@
|
|
48
36
|
|
49
37
|
|
50
38
|
|
51
|
-
|
39
|
+
重回帰分析や多変量解析などの統計手法をPythonで記述する方法と、Chainerの学習をしました。
|
52
40
|
|
53
|
-
しかし、ディープラーニングとは「過去データでモデルを訓練して、新しいデータに対して推測する」ということだと知り、学習の方向性が間違っていることに気づきました。
|
54
|
-
|
55
|
-
|
56
|
-
|
57
|
-
上手く伝わらないかもしれませんが、実現したいことは、相関から未来の数値を予測することではなく、過去のデータから売買シグナルを探すことです。
|
58
|
-
|
59
|
-
|
41
|
+
しかし、これらでは「複数のデータを組み合わせて、先行指標を探す」ことが出来ないことが分かりました。
|
60
|
-
|
61
|
-
例えば、最初の例の売買シグナルが成立する場合でも、大豆先物価格と「アイオワ州の過去1周間の最高気温の合計」の相関係数は限りなく0に近いかもしれません。
|
62
|
-
|
63
|
-
|
64
|
-
|
65
|
-
また、思いも寄らないところに、影響が及んでいるかもしれないので、無関係と思われる様々なデータも分析したいです。
|
66
42
|
|
67
43
|
|
68
44
|
|
@@ -70,7 +46,15 @@
|
|
70
46
|
|
71
47
|
|
72
48
|
|
73
|
-
|
49
|
+
・PythonによるWebスクレイピングを学習中のため、データ収集については、この質問では伺いません。
|
50
|
+
|
51
|
+
・プログラミング初心者のため、課題を解決する手段が誤っている場合(そもそもPythonでは実現できないなど)場合は、ご指摘頂ければ幸いです。
|
52
|
+
|
53
|
+
・株価や先物価格は、あくまで投資家の様々な思惑で上下するため、データとの間に直接的な因果関係があるとは限りません。
|
54
|
+
|
55
|
+
・どのデータの組み合わせが先行指標となっているか、また、それがどの程度の時差があるのかが不明です。それを解き明かすことの出来るライブラリをお教えください。
|
56
|
+
|
57
|
+
|
74
58
|
|
75
59
|
|
76
60
|
|
1
誤字修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
「世界中のあらゆるデータを分析し、株
|
1
|
+
「世界中のあらゆるデータを分析し、株の売買シグナルを発見したい」
|
test
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
|
5
|
+
世界中のあらゆるデータを分析し、株などの売買シグナルを発見したいです。
|
6
6
|
|
7
7
|
|
8
8
|
|
@@ -70,7 +70,7 @@
|
|
70
70
|
|
71
71
|
|
72
72
|
|
73
|
-
|
73
|
+
もし既製品のデータ分析ソフト等で解決可能な問題でしたら、教えて頂ければ幸いです。
|
74
74
|
|
75
75
|
|
76
76
|
|