質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3598閲覧

keras applicationsの学習済みモデルをグレースケール画像に使いたい

SuzuAya

総合スコア71

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/08/07 13:26

前提・実現したいこと

keras.applicationsで使えるモデルはImageNetを使って学習してあるため、基本的にはカラー画像(3チャネル)にしか使えないと思うのですが、グレースケール画像(1チャネル)に使える方法はあるでしょうか。
https://keras.io/ja/applications/
こちらで過去に同じような質問に対する回答がまだなかったため、質問させていただきました。
初歩的な質問で恐縮ですが、ご確認の程どうぞよろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

一番簡単に学習済みの重みを利用できる方法はグレースケール画像をカラー画像 (3チャンネル) に変換することです。
カラー画像として読み込んでも見た目の変化はありません。

イメージ説明

グレースケール画像

イメージ説明

グレースケール画像をカラー画像に変換したもの

グレースケール画像をカラー画像として読み込む。

python

1# PIL の場合 2import cv2 3from PIL import Image 4 5gray = Image.open("sample.png") 6print(img.size, img.mode) # (640, 427) L 7 8rgb = img.convert("RGB") 9print(rgb.size, rgb.mode) # (640, 427) RGB 10 11# OpenCV の場合 12img = cv2.imread("sample.png") 13print(img.shape) 14# デフォルトでグレースケール画像も RGB として読み込まれる。

すでに読み込んであるグレースケール画像をカラー画像に変換するのは Pillow なら img.convert("RGB")、OpenCV なら cv2.cvtColor(img, cv2.COLOR_GRAY2RGB) でできます。

サンプルコード

VGG16 で推論する例

python

1import numpy as np 2from tensorflow.keras.applications.vgg16 import ( 3 VGG16, 4 preprocess_input, 5 decode_predictions, 6) 7from tensorflow.keras.preprocessing import image 8 9# VGG16 を構築する。 10model = VGG16() 11 12# 画像を読み込む。 13img = image.load_img("sample.png", target_size=model.input_shape[1:3]) # デフォルトでグレースケール画像もカラー画像として読み込まれます 14print(img.size, img.mode) # (224, 224) RGB 15 16# PIL -> numpy 17x = image.img_to_array(img) 18 19# バッチ次元追加 20x = np.expand_dims(x, axis=0) 21 22# VGG16 用の前処理を行う。 23x = preprocess_input(x) 24 25# 予測する。 26predictions = model.predict(x) 27 28# 予測結果をデコードする。 29predictions = decode_predictions(predictions, top=3) 30 31for _, name, score in predictions[0]: 32 print(f"{name}: {score:.2%}") 33 34# Egyptian_cat: 7.81% 35# window_screen: 6.24% 36# tabby: 4.62%

グレースケール画像でもちゃんとネコと認識できています。

投稿2019/08/07 13:44

編集2019/08/07 13:47
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SuzuAya

2019/08/08 07:11 編集

>tiitoi様 いつもご丁寧なご回答、本当にありがとうございます! 試しにpillowで以下の通りやってみたらうまくいきました! kerasの学習済みモデルが活用できるようになるのがとても嬉しいです。いつもありがとうございます。 from PIL import Image gray = Image.open("sample.png") print(gray.size, gray.mode) # (640, 427) L rgb = gray.convert("RGB") print(rgb.size, rgb.mode) # (640, 427) RGB
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問