質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

596閲覧

CNNでのsoftmax関数が正しく機能していない?

KazuyaKojima

総合スコア16

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/11/29 06:10

編集2019/11/30 08:28

現在株価の変動チャート画像を用いて株価の騰落予測分類を行うcnnモデルをchainerを用いて組んでおります。
プログラム自体は動くのですが内部の数値の可視化を行うとsoftmax関数で活性化した後の数値が[1,0]から全く変化しないのですがこれは学習が正しく行われていないということでしょうか?

variable([[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]
[1. 0.]])

バッチサイズ20、エポック100で活性化した後の出力を可視化してみるとこのようになっており、エポック100まで一切変化がありません。
入力は480×480×3の下図のような株価変動画像をを用いています
イメージ説明

python

1import matplotlib.pyplot as plt 2import load_data 3import stock_data 4import img_to_vector 5import load_vector 6import numpy as np 7import chainer 8import chainer.links as L 9import chainer.functions as F 10from chainer import Chain, Variable, datasets, optimizers 11from chainer import report, training 12from chainer.training import extensions 13from chainer import iterators 14from chainer import serializers 15import chainer.cuda 16 17#データの準備 18sp500, topix500, usd_jpy = load_vector.load_vector() 19x_train, x_test = topix500[:2000], topix500[2000:] 20 21t_train, t_test = load_data.label(stock_data.teacher_dataset()[:2000]), load_data.label(stock_data.teacher_dataset()[2000:]) 22 23train = list(zip(x_train, t_train)) 24test = list(zip(x_test, t_test)) 25 26class CNN(Chain): 27 def __init__(self): 28 super(CNN, self).__init__() 29 with self.init_scope(): 30 self.cn1 = L.Convolution2D(None, 32, ksize=(5,3), pad=(0,1)) 31 self.cn2 = L.Convolution2D(None, 32, ksize=(5,3), pad=(0,1)) 32 self.fc1 = L.Linear(None, 128) 33 self.fc2 = L.Linear(128, 2) 34 35 def __call__(self, x, t=None): 36 h1 = F.max_pooling_2d(F.relu(self.cn1(x)), ksize=4, stride=4) 37 h2 = F.max_pooling_2d(F.relu(self.cn2(h1)), ksize=4, stride=4) 38 h3 = F.dropout(F.relu(self.fc1(h2))) 39 print(F.softmax(self.fc2(h3))) #**確認** 40 return F.softmax(self.fc2(h3)) 41 42 43model = CNN() 44net = L.Classifier(model) 45optimizer = optimizers.Adam().setup(net) 46 47batchsize = 20 48train_iter = chainer.iterators.SerialIterator(train, batchsize, repeat=True, shuffle=True) 49test_iter = chainer.iterators.SerialIterator(test, batchsize, repeat=False, shuffle=True) 50 51updater = training.StandardUpdater(train_iter, optimizer, device=-1) # device=-1でCPUでの計算実行を指定 52 53epoch = 100 54trainer = training.Trainer(updater, (epoch, 'epoch'), out='result') 55 56# テストデータで評価 57trainer.extend(extensions.Evaluator(test_iter, net, device = -1)) 58 59# 学習を記録 60trainer.extend(extensions.LogReport(trigger=(1, 'epoch'))) 61 62# グラフに描画、保存 63trainer.extend(extensions.PlotReport(['main/loss', 'validation/main/loss'], x_key='epoch', file_name='cnn2_loss.png')) 64trainer.extend(extensions.PlotReport(['main/accuracy', 'validation/main/accuracy'], x_key='epoch', file_name='cnn2_accuracy.png')) 65trainer.extend(extensions.PrintReport(['epoch', 'main/loss', 'main/accuracy','validation/main/loss', 'validation/main/accuracy','elapsed_time']), trigger=(1, 'epoch')) 66 67trainer.run() 68コード

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Q71

2019/11/29 23:29

入力は1次元だと思うのですが、2次元の畳み込みが行なわれています。入力のshapeはどうなっていますか。 ksizeやpaddingは意図したサイズですか?あるいは、どうなることを意図していますか。 畳み込み層最後のshapeはどうなっていますか。
KazuyaKojima

2019/11/30 08:32

入力は画像のような480×480×3になっております。 出力としてはこの画像から次の日の株価が上がるか下がるかといった二値分類を想定しています。 ksizeは意図して長方形にしてpaddingはそれに応じた設定にしています。 次元の遷移としては 480.480.3→480.480.32→120.120.32→120.120.32→30.30.32→1.1.128→1.1.2という形になっております
KazuyaKojima

2019/11/30 08:47

本来であればsoftmax後の結果が[0.545, 0.455]のようにある程度二値の予測結果が分散するはずだと思うのですが現在何度学習しても[1,0]となって全く学習できていないと思われますのでこれをどうにかしたいと思っています
Q71

2019/11/30 10:07

関連を見つけ出すのが機械学習ですが、これは、難しいと思います。あるいは、使うものが悪いかと。
Q71

2019/12/01 04:04

> 本来であればsoftmax後の結果が[0.545, 0.455]のように 参考 http://hiro2o2.hatenablog.jp/entry/2016/07/21/013805 softmax は、入力を「合計すると1になるように、割合に直す」ことをしています。よって、softmaxへの入力が [1, 0] になっていると考えられます。 畳み込み演算は、連続した範囲を1カ所に「畳み込む」ことで関連を見ます。縦を長くとっているのは良いのですが、横が、例えばサンプル画像の一番左の緑であれば、横のつながりが見れません。また、そうでなくても、1日ごとの選の間に空白がありますし、1日分の幅がありますから、前後の日にちとのつながりを関連付けられません。 これらのことから、「サンプルが悪い」「手段が適切ではない」と判断します。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問