質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1467閲覧

Kerasでの学習がうまくいきません

y.isshi

総合スコア7

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/03/18 08:08

編集2020/03/19 00:31

テキストデータをMecabで名詞に変更します。
そのあと、BOWで数値化しています。それをtrain_dataにして、教師データをtrain_label1にしました。
例)各500データ
train_data1→
0 0 0 0 6 8 0 7 9 6 0 7 ・・・0 0 0 7 8
0 0 0 0 6 9 0 0 7 9 8 7 ・・・0 0 0 1 1

train_rabel1→
25
8.5

上記を下記のソースコードで学習させると、下記のようにLossがマイナス値になります。
32/141 [=====>........................] - ETA: 0s - loss: -63.7767 - accuracy: 0.2188
96/141 [===================>..........] - ETA: 0s - loss: -59.5121 - accuracy: 0.1875
141/141 [==============================] - 0s 1ms/step - loss: -50.1103 - accuracy: 0.1986 - val_loss: -20.9677 - val_accuracy: 0.5000

入力データがおかしいのか、Sequentialモデルがおかしいのか・・・
いろいろ変更しましたが、うまくいきません・・・
初心者で申し訳ありませんが、アドバイスいただけないでしょうか?

python

1# Sequentialモデル使用 2model = Sequential() 3 4model.add(Dense(1900, activation='relu', input_shape = ( 950, ))) 5model.add(Dropout(0.5)) 6 7model.add(Dense(500, activation='relu')) 8model.add(Dropout(0.5)) 9 10model.add(Dense(1, activation='softmax')) 11 12 13# モデルをコンパイル 14model.compile(loss="binary_crossentropy", optimizer="sgd", metrics=["accuracy"]) 15 16model.summary() 17 18#訓練 19model.fit(train_data1,train_label1, epochs=300, validation_split=0.1)

修正後のソースコード

python

1# Sequentialモデル使用(Sequentialモデルはレイヤを順に重ねたモデル) 2model = Sequential() 3 4model.add(Dense(1900, activation='relu', input_shape = ( 950, ))) 5model.add(Dropout(0.5)) 6 7model.add(Dense(500, activation='relu')) 8model.add(Dropout(0.5)) 9 10model.add(Dense(1, activation='linear')) 11 12# モデルをコンパイル 13model.compile(loss="mean_squared_error", optimizer="sgd", metrics=["accuracy"]) 14 15model.summary() 16 17#訓練 18model.fit(train_data1,train_label1, epochs=300, validation_split=0.1) 19model.save('model.h5') 20 21score = model.evaluate(test_data1, test_result1) 22print("正解率: %.2f%%" % (score[1] * 100)) 23

予測用のコード

python

1from keras.models import load_model 2import numpy as np 3import csv 4 5test_data=[] 6with open('test.csv') as f: 7 reader = csv.reader(f) 8 for row in reader: 9 test_data.append(row) 10 11test_data1 = np.array(test_data,dtype=np.float64) 12 13 14model = load_model("model.h5") 15 16result = model.predict_classes(test_data1) 17print(result)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

softmax&binary_crossentropyを使うのであれば目的変数は0-1の間の確率にらないといけないので、ラベルの値がおかしいのだと思います。
(一ユニットならsoftmaxにする意味はないのですか、それ以前の問題ですね)

改善案ですが、たとえば単一のスカラを予測させるなら出力層活性化関数はlinearで損失関数はmean_squared_errorとかにするべきでしょう。

投稿2020/03/18 08:42

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y.isshi

2020/03/18 09:38

ご回答ありがとうございます!正常に学習できるようになりました! しかし、予測させると予測値が0か1しか出ません。 学習のラベルには0.5から16くらいまでの値が入っているのですが・・・ 単純に学習データが悪いのでしょうか??
hayataka2049

2020/03/18 10:04

予測値はどうやって得たんでしょうか。
y.isshi

2020/03/19 00:32

予測に使ったコードを追加しました。 データは、同じような下記を入力しています 0 0 1 1 0 0 0 7 9 ・・・0 1 2 0 1
y.isshi

2020/03/19 05:19

すみません・・・predictの指定が間違っていました。数値予測できました。
hayataka2049

2020/03/19 12:26

predict_classesにしたから、でしょうね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問