どんなにエポックを繰り返しても学習精度が０.５ほどになってしまう

CNNでディープラーニングをしています。
どんなにエポックを繰り返しても学習精度が０.５ほどになってしまいます。どう言う原因が考えられますか？
データ数は１万件もあり、過学習の可能性はないです。

コードは以下のように書きました。

# coding: utf-8
import tensorflow as tf
import tflearn

from tflearn.layers.core import input_data,dropout,fully_connected
from tflearn.layers.conv import conv_2d, max_pool_2d
from tflearn.layers.normalization import local_response_normalization
from tflearn.layers.estimator import regression

tf.reset_default_graph()
net = input_data(shape=[None, 4, 42])
net = conv_2d(net, 4, 16, activation='relu')
net = max_pool_2d(net, 1)
net = tflearn.activations.relu(net)
net = dropout(net, 0.5)
net = tflearn.fully_connected(net, 2, activation='softmax')
net = tflearn.regression(net, optimizer='adam', learning_rate=0.5, loss='categorical_crossentropy')

model = tflearn.DNN(net)

model.fit(np.array(trainDataSet), np.array(trainLabel), n_epoch=400, batch_size=32, validation_set=0.1, show_metric=True)

pred = np.array(model.predict(np.array(testDataSet)).argmax(axis=1))

label = np.array(testLabel).argmax(axis=0)
accuracy = np.mean(pred == label, axis=0)

print(accuracy)

行動規範の内容に同意します

回答3件

ベストアンサー

ﾎﾟｲﾝﾄとしてはLossが飽和していてAccがそれに対応していれば過学習です
Accが0.5で落ち着くというのは相当難しいTrainかGANの場合以外大抵は過学習です

投稿2018/11/27 02:48

hamiru

総合スコア29

taiyo2017

2018/11/27 03:27

ありがとうございます。過学習かと思い、dropout層を増やしてみたところ、lossは下がりましたが、accは依然として０.５から変わりませんでした。この状態は、一体どう言う現象なのでしょうか？

hamiru

2018/11/27 03:43

TrainDataからValDataを拾ってませんか？ Codeを見ないとわからないですね。

hamiru

2018/11/27 03:44

でもLossがさがってもAccが下がらないのはやはり過学習の典型です

taiyo2017

2018/11/27 04:08

多分拾っていないと思います。コードを質問文に貼り付けました。

taiyo2017

2018/11/27 04:08

もしご存知ならよろしくお願いいたします。なるほど、そうなのですね。。。

hamiru

2018/11/27 11:17 編集

もしこのcodeがどこからかの引用でそこそこaccがでているのなら見当違いの回答になってしまいますが、個人的な見解を。 ValDataを入れるときはDropoutの値を1にしないとaccが下がってしまいますけど、その点は問題ないですよね？しかし最初はDropout入れていなかったということなのでその他で考えられることといえば、Convが少ないような気がします。あと二つくらい追加したらいかがでしょうか？Convが少ない状態でLeaning rate0.5だと極値に落ちてもどってこられないのではないかとおもいます。Convを増やさないのであれば文献値の5e-4とかがいいのでは

taiyo2017

2018/11/29 08:31

ありがとうございます。conv層はどこに追加した方がいいとかありますか？

hamiru

2018/11/30 07:34

Conv,BN,Relu,Conv,BN,Relu,Pooltとかが一般的ですね https://mathematica.stackexchange.com/questions/156158/why-inception-v3-trained-on-imagenet-competition-data-have-1001-outputs

行動規範の内容に同意します

minibatchの作り方として順番に取り出す方法が良く提案されていますが、
やはりClipしてランダムに都度作成するのがTrainDataを有効に使える方法だと思います。
Imageの場合はKerasのImageDataGeneratorが特に有効です。
私自身Tensorflowを使ってますがTrainDataの水増しには上記を使っています。

投稿2018/11/27 03:15

hamiru

総合スコア29