O'Reilly Japan - ゼロから作るDeep LearningにあるCNNのソースを利用して、オリジナルのデータで学習をさせています。ソースで変更を加えているのは、画像の縦横ピクセル数だけです。
deep-learning-from-scratch/train_convnet.py at master · oreilly-japan/deep-learning-from-scratch
実際のソースはこちらです。
http://104.199.186.194/CNN/02_CNN.html
3500枚くらいの画像と、0 or 1の正解ラベルのセットのデータを使用しています。
データはこのような形です。
■学習用データ
x_train _ (2400, 1, 90, 90)
t_train _ (2400,)
■評価用データ
x_test _ (1059, 1, 90, 90)
t_test _ (1059,)
データの実物は下記になります。
http://104.199.186.194/stock_img_all.php
「チャート」の列が画像で、「判定」が正解ラベルです。
「判定」はこの銘柄が一定期間後に5%以上値上がりしたか?を判定したものになります。
学習用データと評価用データは証券コード順に並べたときの上位2400件、とそれ以外で分けていますので、元々の出処は、同じ作り方をしたデータです。
実行結果は下記のようになります。
正解ラベルの内訳は次のとおりです。
+------+----------+
| 0 | 3236 |
| 1 | 223 |
+------+----------+
ざっくりとした質問で恐縮ですが、この結果から、画像データと正解ラベルのデータには相関関係がないと判断してよろしいでしょうか。
trainの正解率は除々に上昇しているので、CNNのパラメーターは最適化していると思いますが、testの結果が上昇してきませんので、そのように考えています。
回答1件
あなたの回答
tips
プレビュー