質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

1001閲覧

kerasの学習済みモデルの予測が外れる原因が知りたい

seyu0930

総合スコア20

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/08/02 05:44

画像認識プログラミングレシピという本で学習中です。

以下のコードを参考にkerasで学習済みモデルを作りました。

https://github.com/Kokensha/book-ml/blob/master/Colaboratory/05_01(TensorFlow_Keras_MNIST).ipynb

※saveするまでにエラーが出る部分があったので
def plot_loss_accuracy_graphの[acc]の部分を[accuracy]にしたり
教師ラベルデータの変換のkeras.utils.to_categoricalをnp_utils.to_categoricalに変更しました。

聞きたいこと

model.saveした学習済みモデルで手書き数字が本当に予測できるか試そうと思いやってみました。

python

1import numpy as np 2import tensorflow as tf 3from tensorflow import keras 4from tensorflow.python.keras.models import load_model 5from PIL import Image 6import matplotlib.pyplot as plt 7import cv2 8 9model = load_model("/content/drive/MyDrive/keras-mnist-model2.h5") 10 11image = cv2.imread("/content/3の画像.png", 0) 12print(image.shape) 13image = cv2.resize(image, dsize=(28, 28)) 14 15image = image.reshape(1, 28, 28, 1) 16 17image = image.astype("float32") 18 19image = image / 255 20 21prediction = model.predict(image) 22 23zero_to_nine = ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9",] 24 25number = np.argmax(prediction) 26print("予測結果:", zero_to_nine[number])

そこで1つほど質問があります。
mnistでloadした検証用手書き数字ではしっかり予測できているのですが、ネットで拾ってきた手書き数字だと全く予測が外れます。何が原因なのでしょうか?

今回kerasも初めて触ったので何がおかしくてどう改善すればいいのか手探り状態です。予測するためのコードも見様見真似で書いたので汚いと思いますが、ここ直したらいいよっていうのがあれば教えてください。

予測できた画像
イメージ説明
イメージ説明

予測が外れた画像
イメージ説明
イメージ説明
イメージ説明
そのほかにも試しましたが、同じように外れました。

質問する上で不足していることがあれば修正いたしますので、よろしくお願いします。
ちなみに学習正解率は97%です。

googlecolabの環境
keras2.5.0
tensorflow2.5.0
numpy1.19.5

macOSXを利用

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

「MNISTで高精度に訓練したモデルに、独自の手書き数字をテストすると、ほとんど認識されない」というのは、普通の現象です。これは、訓練したモデルがMNISTのデータに過学習しているために発生します。認識率を向上させるために、データ拡張を行うことが多いです。

参考: 【MNIST】データ拡張で「汎化性能」UPっぷ【認識率UP!】

上記の他にも、「MNIST データ拡張」でググってみてくたさい。

投稿2021/08/02 09:00

編集2021/08/02 09:01
toast-uz

総合スコア3266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

seyu0930

2021/08/02 09:09

コメントありがとうございます。拝見させていただきます。自分で考えろって言われそうですが、私のpredictのコード自体には原因となるところはなさそうですか?
toast-uz

2021/08/02 09:31

predictのコードにMNISTのデータを通して検証すると良いと思います。MNISTのデータなら予測精度が高いが、他の手書きデータなら予測精度が悪いのであれば、予測コードは間違っておらず、モデルの汎化性能に問題があると、切り分けできます。
guest

0

明確な答えはわかりませんが,
予測できた画像はカラー画像で,
予測が外れた画像はグレースケール画像のように見受けられます.
上記のプログラム中で入力画像はグレースケール画像の仕様になっていると見えます.
が,予測できた画像がカラー画像ならば,使用した学習済みモデルはカラー画像を入力するように推測されるのですが,そのあたりの整合性はどうなのでしょうか?

投稿2021/08/02 06:11

LenItsuki

総合スコア89

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

seyu0930

2021/08/02 09:01

ご回答ありがとうございます。 正解したものはカラー画像で不正解だったものはグレースケール画像である可能性が高いということでしょうか?
LenItsuki

2021/08/02 09:58

うーん,プログラム的には,1チャンネル(グレースケール)を扱うようになっているように見えるのですが,そうだとすると,そもそもでカラー画像を入力しようとすると,tensorの次元が合わないなどのエラーを吐いて,動かないと思うので,なぜ正解した画像がカラーなのか?不思議です.(自動でグレースケールにする処理入ってますか?) もちろん,他の回答のとおり,そもそも汎化性能が弱いだけという理由はありえるところですが.
toast-uz

2021/08/02 10:23

「予測できた画像」はカラーではないです。グレースケールの画像は、このような色合い(黄色〜紫)で表示されることがあります。
LenItsuki

2021/08/03 03:14

失礼いたしました.きっと,toast-uzさんの言う通りです.でないと,辻褄が合わないので.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問