CNNでのsoftmax関数が正しく機能していない？

現在株価の変動チャート画像を用いて株価の騰落予測分類を行うcnnモデルをchainerを用いて組んでおります。
プログラム自体は動くのですが内部の数値の可視化を行うとsoftmax関数で活性化した後の数値が[1,0]から全く変化しないのですがこれは学習が正しく行われていないということでしょうか？

variable([[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]])

バッチサイズ２０、エポック１００で活性化した後の出力を可視化してみるとこのようになっており、エポック１００まで一切変化がありません。
入力は480×480×3の下図のような株価変動画像をを用いています

python
1import matplotlib.pyplot as plt
2import load_data
3import stock_data
4import img_to_vector
5import load_vector
6import numpy as np
7import chainer
8import chainer.links as L
9import chainer.functions as F
10from chainer import Chain, Variable, datasets, optimizers
11from chainer import report, training
12from chainer.training import extensions
13from chainer import iterators
14from chainer import serializers
15import chainer.cuda
16
17#データの準備
18sp500, topix500, usd_jpy = load_vector.load_vector()
19x_train, x_test = topix500[:2000], topix500[2000:]
20
21t_train, t_test = load_data.label(stock_data.teacher_dataset()[:2000]), load_data.label(stock_data.teacher_dataset()[2000:])
22
23train = list(zip(x_train, t_train))
24test = list(zip(x_test, t_test))
25
26class CNN(Chain):
27    def __init__(self):
28        super(CNN, self).__init__()
29        with self.init_scope():
30            self.cn1 = L.Convolution2D(None, 32, ksize=(5,3), pad=(0,1))
31            self.cn2 = L.Convolution2D(None, 32, ksize=(5,3), pad=(0,1))
32            self.fc1 = L.Linear(None, 128)
33            self.fc2 = L.Linear(128, 2)
34
35    def __call__(self, x, t=None):
36        h1 = F.max_pooling_2d(F.relu(self.cn1(x)), ksize=4, stride=4)
37        h2 = F.max_pooling_2d(F.relu(self.cn2(h1)), ksize=4, stride=4)
38        h3 = F.dropout(F.relu(self.fc1(h2)))
39        print(F.softmax(self.fc2(h3))) #**確認**
40        return F.softmax(self.fc2(h3))
41
42
43model = CNN()
44net = L.Classifier(model)
45optimizer = optimizers.Adam().setup(net)
46
47batchsize = 20
48train_iter = chainer.iterators.SerialIterator(train, batchsize, repeat=True, shuffle=True)
49test_iter = chainer.iterators.SerialIterator(test, batchsize, repeat=False, shuffle=True)
50
51updater = training.StandardUpdater(train_iter, optimizer, device=-1) # device=-1でCPUでの計算実行を指定
52
53epoch = 100
54trainer = training.Trainer(updater, (epoch, 'epoch'), out='result')
55
56# テストデータで評価
57trainer.extend(extensions.Evaluator(test_iter, net, device = -1))
58
59# 学習を記録
60trainer.extend(extensions.LogReport(trigger=(1, 'epoch')))
61
62# グラフに描画、保存
63trainer.extend(extensions.PlotReport(['main/loss', 'validation/main/loss'], x_key='epoch', file_name='cnn2_loss.png'))
64trainer.extend(extensions.PlotReport(['main/accuracy', 'validation/main/accuracy'], x_key='epoch', file_name='cnn2_accuracy.png'))
65trainer.extend(extensions.PrintReport(['epoch', 'main/loss', 'main/accuracy','validation/main/loss', 'validation/main/accuracy','elapsed_time']), trigger=(1, 'epoch'))
66
67trainer.run()
68コード

Q71

2019/11/29 23:29

入力は1次元だと思うのですが、2次元の畳み込みが行なわれています。入力のshapeはどうなっていますか。 ksizeやpaddingは意図したサイズですか？あるいは、どうなることを意図していますか。畳み込み層最後のshapeはどうなっていますか。

KazuyaKojima

2019/11/30 08:32

入力は画像のような480×480×3になっております。出力としてはこの画像から次の日の株価が上がるか下がるかといった二値分類を想定しています。 ksizeは意図して長方形にしてpaddingはそれに応じた設定にしています。次元の遷移としては 480.480.3→480.480.32→120.120.32→120.120.32→30.30.32→1.1.128→1.1.2という形になっております

KazuyaKojima

2019/11/30 08:47

本来であればsoftmax後の結果が[0.545, 0.455]のようにある程度二値の予測結果が分散するはずだと思うのですが現在何度学習しても[1,0]となって全く学習できていないと思われますのでこれをどうにかしたいと思っています

Q71

2019/11/30 10:07

関連を見つけ出すのが機械学習ですが、これは、難しいと思います。あるいは、使うものが悪いかと。

Q71

2019/12/01 04:04

> 本来であればsoftmax後の結果が[0.545, 0.455]のように参考 http://hiro2o2.hatenablog.jp/entry/2016/07/21/013805 softmax は、入力を「合計すると1になるように、割合に直す」ことをしています。よって、softmaxへの入力が [1, 0] になっていると考えられます。畳み込み演算は、連続した範囲を1カ所に「畳み込む」ことで関連を見ます。縦を長くとっているのは良いのですが、横が、例えばサンプル画像の一番左の緑であれば、横のつながりが見れません。また、そうでなくても、1日ごとの選の間に空白がありますし、1日分の幅がありますから、前後の日にちとのつながりを関連付けられません。これらのことから、「サンプルが悪い」「手段が適切ではない」と判断します。