質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

Kerasにおける画像の2クラス分類で学習が進まない、lossが減らない。

gammaman
gammaman

総合スコア3

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

2回答

0評価

0クリップ

1321閲覧

投稿2021/02/16 13:09

編集2021/02/16 13:13

カラー画像をkerasを使っての2クラス分類を試みています。
しかし、train_lossが減らず、train_accuracy,val_accuracy共に0.5前後をさまよってしまいます。

以下、使用したコードを載せます。

python

import os import re import tensorflow.keras from tensorflow.keras import utils, datasets, optimizers from tensorflow.keras.layers import Input, Embedding, LSTM, Conv2D, MaxPooling2D, concatenate from tensorflow.keras.models import Sequential, Model from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten from tensorflow.keras.preprocessing.image import array_to_img, img_to_array, load_img from tensorflow.keras.applications.resnet50 import ResNet50 import numpy as np np.set_printoptions(threshold=np.inf) def list_pictures(directory, ext='jpg|jpeg|bmp|png|ppm'): return [os.path.join(root, f) for root, _, files in os.walk(directory) for f in files if re.match(r'([\w]+.(?:' + ext + '))', f.lower())] # フォルダの中にある画像を順次読み込む # カテゴリーは0から始める X = [] Y = [] i=0 # 対象Aの画像 for picture in list_pictures('./images/png/train/A/'): img = img_to_array(load_img(picture, target_size=(64,64))) X.append(img) Y.append(0) i=i+1 if i >= 20865: break j=0 # 対象Bの画像 for picture in list_pictures('./images/png/train/B/'): img = img_to_array(load_img(picture, target_size=(64,64))) X.append(img) Y.append(1) j=j+1 if j >= 20865: break # arrayに変換 images = np.asarray(X) labels = np.asarray(Y) images = images.astype('float32') images /= 255.0 #データのシャッフル p = np.random.permutation(len(images)) images = images[p] labels = labels[p] ###モデルの定義### image_input = Input(shape=(64, 64, 3,), name='image_input') ResNet50 = ResNet50(include_top=False, weights=None, input_shape=(64, 64, 3))(image_input) x = Flatten()(ResNet50) image_out = Dense(1, activation='relu')(x) main_output = Dense(1, activation='sigmoid', name='main_output')(image_out) model = Model(inputs=[image_input], outputs=[main_output]) model.compile(optimizer=optimizers.SGD(lr=1e-2, momentum=0.9), loss='binary_crossentropy', metrics=['accuracy']) model.summary() model.fit( images, labels, epochs=100, batch_size=16, validation_split=0.1, shuffle=True)
Epoch 1/100 2021-02-16 21:54:43.420110: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10 2021-02-16 21:54:43.598753: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7 2348/2348 [==============================] - 57s 24ms/step - loss: 0.6935 - accuracy: 0.5003 - val_loss: 0.6931 - val_accuracy: 0.5006 Epoch 2/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6936 - accuracy: 0.4968 - val_loss: 0.6939 - val_accuracy: 0.5006 Epoch 3/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6937 - accuracy: 0.4971 - val_loss: 0.6934 - val_accuracy: 0.5006 Epoch 4/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6936 - accuracy: 0.4979 - val_loss: 0.6937 - val_accuracy: 0.5006 Epoch 5/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6935 - accuracy: 0.5046 - val_loss: 0.6934 - val_accuracy: 0.4994 Epoch 6/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6935 - accuracy: 0.4979 - val_loss: 0.6942 - val_accuracy: 0.5006 Epoch 7/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6937 - accuracy: 0.4988 - val_loss: 0.6932 - val_accuracy: 0.5006 Epoch 8/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6934 - accuracy: 0.5037 - val_loss: 0.6933 - val_accuracy: 0.5006 Epoch 9/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6935 - accuracy: 0.4993 - val_loss: 0.6942 - val_accuracy: 0.4994 Epoch 10/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6936 - accuracy: 0.4982 - val_loss: 0.6933 - val_accuracy: 0.5006 Epoch 11/100 2348/2348 [==============================] - 55s 23ms/step - loss: 0.6936 - accuracy: 0.4990 - val_loss: 0.6936 - val_accuracy: 0.5006 Epoch 12/100 2348/2348 [==============================] - 55s 23ms/step - loss: 0.6937 - accuracy: 0.4970 - val_loss: 0.6932 - val_accuracy: 0.5006 Epoch 13/100 2348/2348 [==============================] - 56s 24ms/step - loss: 0.6936 - accuracy: 0.4988 - val_loss: 0.6932 - val_accuracy: 0.4994 Epoch 14/100 2348/2348 [==============================] - 55s 23ms/step - loss: 0.6935 - accuracy: 0.4989 - val_loss: 0.6932 - val_accuracy: 0.5006

試したこと

学習用データをシャッフルせずに学習したところ、正答率は0.9をこえました。
ということは学習用データをシャッフルする過程に問題があるのでしょうか?

Epoch 1/100 2021-02-16 21:45:31.089529: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10 2021-02-16 21:45:31.269549: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudnn.so.7 2348/2348 [==============================] - 61s 26ms/step - loss: 0.1165 - accuracy: 0.9726 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 2/100 2348/2348 [==============================] - 60s 25ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 3/100 2348/2348 [==============================] - 60s 25ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 4/100 2348/2348 [==============================] - 60s 25ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 5/100 2348/2348 [==============================] - 59s 25ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 6/100 2348/2348 [==============================] - 60s 26ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000 Epoch 7/100 2348/2348 [==============================] - 60s 26ms/step - loss: 0.1806 - accuracy: 0.9472 - val_loss: 0.0100 - val_accuracy: 1.0000

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

meg_

2021/02/16 13:35

> 学習用データをシャッフルせずに学習したところ、正答率は0.9をこえました。 そのモデルでテストした場合の正答率はどうなりますか?
fourteenlength

2021/02/16 13:50

> lr=1e-2 学習率が高いような気もします。 学習率が高いとLossが高いままふらふらする(最悪発散する)傾向があります。 lossを見るとそういうことが起きているような感じがするためです。 1.0e-3かe-4くらいで試していただけますか?
aipy2020

2021/02/16 14:23

>学習用データをシャッフルせずに学習したところ、正答率は0.9をこえました。 「シャッフル」は、 p = np.random.permutation(len(images)) images = images[p] labels = labels[p] のことでしょうか? それとも model.fitの"shuffle=True" のことでしょうか?
gammaman

2021/02/18 07:38 編集

皆様ありがとうございます。遅れてすみません。 meg_さん 申し訳ございません。テストの仕方が分かりませんので今すぐにはお答えできません。 勉強不足です。 fourteenlengthさん 学習率を小さくしてもLossが減らず正答率0.5前後をふらふらしています aipy2020さん 二つのシャッフルを無効にしました
fourteenlength

2021/02/18 09:51

あとはあるとすれば読み込んだ画像がちゃんと読めていない系のポカの可能性がありそうです。OpenCVかmatplotlibで読み込んだ画像を1000枚に一枚くらい表示させて最大値最小値が狙い通りか確認してはいかがでしょうか?ビューワーで見るだけだと最大最小が確認できませんのでがぞうが0-1か0-255か、もっと別かチェックする意図で書いています。
gammaman

2021/02/18 10:26

一応、画像が0-1の値をとることは確認しました。 こちらで解決できました。自己解決欄に書いておきます。 みなさん、どうもありがとうございました!

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。