質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.45%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

CNN (Convolutional Neural Network)

CNN (Convolutional Neural Network)は、全結合層のみではなく畳み込み層とプーリング層で構成されるニューラルネットワークです。画像認識において優れた性能を持ち、畳み込みニューラルネットワークとも呼ばれています。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

519閲覧

model.predictを行う際に透明の画像,白色か黒色の画像を分類させない

semisemi

総合スコア18

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

CNN (Convolutional Neural Network)

CNN (Convolutional Neural Network)は、全結合層のみではなく畳み込み層とプーリング層で構成されるニューラルネットワークです。画像認識において優れた性能を持ち、畳み込みニューラルネットワークとも呼ばれています。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2022/10/24 13:20

編集2022/10/24 14:54

前提

tensorflowのkerasを用いて画像分類を行っているのですが、model.predictを行う際に透明の画像,または白色か黒色の画像を分類させないということをしたいです。

実現したいこと

・tensorflowのkerasでmodel.predictを行う際に透明の画像か白色か黒色の画像を分類させない

発生している問題・エラーメッセージ

ValueError: Input 0 of layer sequential is incompatible with the layer: expected axis -1 of input shape to have value 3 but received input with shape [None, 50, 50, 4]

該当のソースコード

python

1###追記### 2def kiritori(img): 3 img_array=np.array(img,dtype='int16') #(50行,83列,3次元)の3次元配列 4 a=np.split(img_array,img.height/50) 5 img_data=np.split(a[0],img.width/50,axis=1)#stackする土台づくり 6 for i in range(len(a)-1): 7 img_data=np.vstack([img_data,np.split(a[i+1],img.width/50,axis=1)]) 8 return img_data 9 10 11test_data = Image.open('Output_file/dst.png') 12 13copy_back=test_data.copy() 14x_test=kiritori(test_data) 15x_test = x_test/255. 16 17# ##精度のアウトプット 18probs=model.predict(x_test) #学習したパラメータで精度を出力 19probs_max=np.reshape(np.argmax(probs,axis=1),(int(test_data.height/50),int(test_data.width/50))) 20np.savetxt('Output_file/output.csv',probs_max,fmt="%d",delimiter=",")

試したこと

dst.pngは、白色の部分を透過した画像になっています。
kiritori関数は、画像を50×50ずつ分割する関数です。

解決方法を教えていただけると幸いです。

補足情報(FW/ツールのバージョンなど)

windows10(64bit)
anacondaを使用
python 3.8.13
TensorFlow 2.3
Spyder 5.3.3を利用

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

PondVillege

2022/10/24 13:36

「分類させない」ということは,そもそも予測model.predictさせない,ということですか?それとも分類結果から省きたい.ということですか?
semisemi

2022/10/24 13:43

コメントありがとうございます。 予測させたくないです。
PondVillege

2022/10/24 13:52

では,RGBAのうちAlphaチャンネルが全部0であれば透明画像,RGBでchannel-wiseに和をとって値が0であれば黒,値が255 * 3 = 765であれば白,画像全体にこの判定を用いて画像全体が黒であるか/白であるかという判定ができると思います. kiritori関数に実装されてはいかがでしょうか.
semisemi

2022/10/24 14:53

すみません、私の力量では実装できなかったのでお力添えいただませんか? kiritori関数を追記しておきます。
jbpb0

2022/10/25 03:05

コードよく読んでないので勘違いしてるかもしれませんが、「予測させたくない」画像は > img_data=np.vstack(... を実行しないようにしたいのなら、その行のすぐ上に「if」文を追加して、 ・「画像全体が透明」ではない ・「画像全体が白」ではない ・「画像全体が黒」ではない が全て成立する場合だけ > img_data=np.vstack(... を実行するようにしたらいいのではないですかね
semisemi

2022/10/25 07:16

コメントありがとうございます。 画像全体が透明な場合if img_data[j,:,:,3]でしようと思ったのですができません。 画像全体を選択するには、どのようにすればよいでしょうか?
PondVillege

2022/10/25 07:19

NWHC形式なら,img_data[i,:,:,3]でAlphaチャネルを取得できているはずです. img_data[i,:,:,3].sum() == 0で透明画像である.ということになるはずですがうまくいかないですか?
semisemi

2022/10/25 07:35

kiritori関数を実行したのちに以下のコードを挿入して透明画像の判定をしようとしたのですが、 IndexError:too many indices for array: array is 3-dimensional, but 4 were indexedがでました。 img_dataのshapeは、119277,50,50,4です。 for j in range(119277): if img_data[j,:,:,3].sum() != 0: img_data = np.vstack(img_data)
PondVillege

2022/10/25 07:43

すみません,理解/伝達不足でした. stack()の形式で書くなら最初の動作で3-dimensionalなので確かにこれでは無理そうですね. np.split(a[i+1],img.width/50,axis=1) に対してnp.split(a[i+1],img.width/50,axis=1)[:,:,3].sum() == 0とかはできると思いますがどうでしょう.
jbpb0

2022/10/25 08:19

> kiritori関数を実行したのちに以下のコードを挿入して透明画像の判定をしようとした 「kiritori」を実行した「後」だと、もう手遅れでは?? 「kiritori」の内部で、「img_data=np.vstack(...」を実行するよりも前で判定して、ダメなやつはそれ実行しないようにしないといけないような
semisemi

2022/10/25 08:45 編集

kiritori関数を下記のようにしたところエラーはなくなったのですが、うまく処理ができていません。 img_array=np.array(img,dtype='int16') #(50行,83列,3次元)の3次元配列 a=np.array(np.split(img_array,img.height/50)) img_data=np.array(np.split(a[0],img.width/50,axis=1))#stackする土台づくり for i in range(len(a)-1): if img_data[i,:,:,3].sum() == 0 and a[i,:,:,3].sum() == 0: img_data = np.vstack([img_data,np.split(a[i+1],img.width/50,axis=1)])
jbpb0

2022/10/26 07:11

質問に記載のコードの > img_data=np.vstack( のすぐ上に「if」文を追加して判定するのだと、 > img_data=np.split(a[0],img.width/50,axis=1)#stackする土台づくり に予測させたくない画像が含まれてる場合は除外できないと思って、そうならないコードを回答に書いたのですが、ちょっと遅かったようですね
guest

回答2

0

ベストアンサー

python

1 img_data=np.split(a[0],img.width/50,axis=1)#stackする土台づくり

の中に予測させたくない画像が含まれてる場合でも除外できるようにしました

 

python

1def kiritori(img): 2 img_array=np.array(img,dtype='int16') 3 a=np.split(img_array,img.height/50) 4 img_data=np.zeros((1, 50, 50, 4))#stackする土台づくり 5 for i in range(len(a)): 6 img_data_tmp=np.split(a[i],img.width/50,axis=1) 7 for j in range(len(img_data_tmp)): 8 if img_data_tmp[j][:, :, :3].max() != 0 and img_data_tmp[j][:, :, :3].min() != 255 and img_data_tmp[j][:, :, 3].max() != 0: 9 img_data=np.vstack([img_data, np.expand_dims(img_data_tmp[j], 0)]) 10 img_data = np.delete(img_data, 0, 0) 11 return img_data

投稿2022/10/26 07:02

編集2022/10/26 07:05
jbpb0

総合スコア7653

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

フォルダから画像を取得するようにして予測させることが出来ました。

投稿2022/10/26 06:39

semisemi

総合スコア18

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.45%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問