質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3139閲覧

2クラス分類NNの精度を上げたい

GK.1225

総合スコア22

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/10/28 11:14

約3万枚の教師データを用いて2クラス分類を行っています。実際に分類させてみたところ、損失関数の値が0.5ぐらいで止まり、正解率も75%ほどで落ち着いてしまいました。VGG16のモデルを用いた転移学習も行ってみましたが、違いが見られませんでした。精度の低さは何が原因と考えられるのか教えていただきたいです。

精度、損失関数の推移

イメージ説明
イメージ説明

from google.colab import drive drive.mount('/content/drive') import keras import glob import numpy as np import sklearn.model_selection from keras.preprocessing.image import load_img, img_to_array from keras.models import Sequential from keras.layers import Conv2D, MaxPooling2D from keras.layers import Dense, Dropout, Flatten from keras.utils import plot_model from keras import optimizers import matplotlib.pyplot as plt import time import tensorflow import sys from keras.callbacks import LearningRateScheduler x_test = np.load("/content/drive/My Drive/npy_files/x_test.npy") x_train = np.load("/content/drive/My Drive/npy_files/x_train.npy") y_test = np.load("/content/drive/My Drive/npy_files/y_test.npy") y_train = np.load("/content/drive/My Drive/npy_files/y_train.npy") #2 各種設定 #train_data_path = '/content/drive/My Drive/dataset' # ここを変更。Colaboratoryにアップロードしたzipファイルを解凍後の、データセットのフォルダ名を入力 image_size = 120 # ここを変更。必要に応じて変更してください。「28」を指定した場合、縦28横28ピクセルの画像に変換します。 color_setting = 3 #ここを変更。データセット画像のカラー:「1」はモノクロ・グレースケール。「3」はカラー。 folder = ['Eliptical', 'Spiral'] # ここを変更。データセット画像のフォルダ名(クラス名)を半角英数で入力 class_number = len(folder) print('今回のデータで分類するクラス数は「', str(class_number), '」です。') #4 機械学習(人工知能)モデルの作成 – 畳み込みニューラルネットワーク(CNN)・学習の実行等 model = Sequential() model.add(Conv2D(96, (11, 11), padding='same',input_shape=(image_size, image_size, color_setting), activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Conv2D(256, (5, 5), padding='same', activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.5)) model.add(Conv2D(384, (3, 3), padding='same', activation='relu')) model.add(Conv2D(384, (3, 3), padding='same', activation='relu')) model.add(Conv2D(384, (3, 3), padding='same', activation='relu')) model.add(Dropout(0.5)) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Flatten()) model.add(Dense(64, activation='relu')) model.add(Dense(64, activation='relu')) model.add(Dropout(0.5)) model.add(Dense(class_number, activation='softmax')) #Adagrad = keras.optimizers.Adagrad(lr=0.01, epsilon=None, decay=0.0) #sgd = keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False) Adam = keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0, amsgrad=False) #RMS = keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=None, decay=0.0) model.summary() plot_model(model, to_file='/content/drive/My Drive/model.png') model.compile(loss='categorical_crossentropy', optimizer=Adam, metrics=['accuracy']) start_time = time.time() # ここを変更。必要に応じて「batch_size=」「epochs=」の数字を変更。 history = model.fit(x_train,y_train, batch_size=256, epochs=200, verbose=1, validation_data=(x_test, y_test),) plt.plot(history.history['accuracy']) plt.plot(history.history['val_accuracy']) plt.title('Model accuracy') plt.ylabel('Accuracy') plt.xlabel('Epoch') plt.grid() plt.legend(['Train', 'Validation'], loc='upper left') plt.savefig('/content/drive/My Drive/acc.png') plt.show() plt.plot(history.history['loss']) plt.plot(history.history['val_loss']) plt.title('Model loss') plt.ylabel('Loss') plt.xlabel('Epoch') plt.grid() plt.legend(['Train', 'Validation'], loc='upper left') plt.savefig('/home/kawada/results/loss.png') plt.show()### ヘディングのテキスト open('cnn_model.json','w').write(model.to_json()) model.save_weights('/content/drive/My Drive/cnn_weights.h5') score = model.evaluate(x_test, y_test, verbose=0) print('Loss:', score[0], '(損失関数値 - 0に近いほど正解に近い)') print('Accuracy:', score[1] * 100, '%', '(精度 - 100% に近いほど正解に近い)') print('Computation time(計算時間):{0:.3f} sec(秒)'.format(time.time() - start_time))

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/10/28 12:35

> 約3万枚の教師データを用いて2クラス分類を行っています。 クラス毎の割合はどうなっていますか?
GK.1225

2020/10/28 12:42

ご質問ありがとうございます。16000枚と13000枚になっています。
guest

回答1

0

ベストアンサー

・Data augmentationを追加してみる。
・batch sizeを小さくしてみる。
・もっと大きなモデルに変更してみる(ResNetやEfficientNetなど)。
などでしょうか。
過学習というよりはTrain_lossの下がりもあまりよくないようなので、モデルを大きくするのが一番効果的かもしれません。ただ、人の目で見ても判断が難しいような難易度の高いタスクの場合、これくらいで落ち着くケースもあるかと思います。
ちなみに、Validationのグラフのブレが大きいのが気になります。入力される画像のarrayが正しい形状と値になっているかも確認してみてください。きちんと0-1のfloatになっていますか?

投稿2020/10/29 14:07

Ryomax

総合スコア68

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

GK.1225

2020/10/31 09:00

回答ありがとうございます。 入力画像の形状について確認したところ0-1の値になっていました。 モデルの規模をより大きくしたところ、train-lossはかなり改善されたのですがval-lossが過学習を起こしてしまいました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問