openCVにおいてグレースケールに変換する際に何が起きているのか。

前提

Python3系でopenCVを使ってます。適当な画像をグレースケールに変換する際には、

python
1import cv2
2image = cv2.imread("lena.jpg")
3gly_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

などとすると思います。ここでは、カレントディレクトリにlena画像lena.jpgがあるとしてソースコードを書きました。ここでimageは各ピクセルに(R,G,B)を含むテンソルになっているはずで、実際に

python
1print(image)

とすると、

[[[ 74 111 195]
[ 73 110 194]
[ 75 111 195]
...
[ 30 32 72]
[ 33 34 68]
[ 34 35 63]]

[[ 71 108 192]
[ 72 109 193]
[ 76 112 196]
...
[ 27 28 66]
[ 29 31 62]
[ 30 31 57]]

[[ 73 110 194]
[ 74 110 194]
[ 76 112 196]
...
[ 24 27 58]
[ 29 30 56]
[ 30 31 52]]

...

[[ 50 59 102]
[ 43 54 98]
[ 52 64 112]
...
[ 64 66 100]
[ 57 59 93]
[ 53 54 88]]

[[ 60 69 112]
[ 53 64 108]
[ 48 59 109]
...
[ 62 64 98]
[ 58 61 92]
[ 56 58 89]]

[[ 66 75 118]
[ 60 70 117]
[ 49 60 110]
...
[ 60 63 94]
[ 59 61 92]
[ 60 62 93]]]

というテンソル表現を得ることができます。一方で、gly_imageは各ピクセルに一つの値が割り当てられる行列になっているはずで、実際に

python
1print(gly_image)

とすると、次のような行列表現が得られます。

[[132 131 132 ... 44 44 43]
[129 130 133 ... 39 40 39]
[131 131 133 ... 36 38 37]
...
[ 71 66 77 ... 76 69 64]
[ 81 76 73 ... 74 70 67]
[ 87 83 74 ... 72 70 71]]

疑問

このグレースケールへの変換で何が行われているのでしょうか。OpenCVの公式ページを見ると、グレースケール変換の際には、(R,G,B)は

Y=0.299⋅R+0.587⋅G+0.114⋅B

と変換されるはずです。しかし、うえのlena画像のグレースケール変換前のテンソルとグレースケール変換後の配列の中身を比べると、例えば、1行1列目を見れば、[ 74 111 195]が132になっています。上の公式にあてはめると、

Y=0.29974+0.587111+0.114*195=109.513

なので、132になるのはおかしいのです。
つまり、一見すると、OpenCVの公式ページとは異なる変換が行われているように思えるのですが、これはどういうことでしょうか。

行動規範の内容に同意します

回答2件

ベストアンサー

BGRなので

python
1b, g, r = 74, 111, 195
2y = 0.299 * r + 0.587 * g + 0.114 * b
3print(y)  # 131.898

と考えると辻褄が合うように思います。

投稿2018/05/14 11:02

KSwordOfHaste

総合スコア18394

physics303

2018/05/14 11:06

ものすごい恥ずかしいのですが、カラー画像で各ピクセルに割り当てられる数字は(R,G,B)ではなく(B,G,R)なのでしょうか？

KSwordOfHaste

2018/05/14 11:09

COLOR_BGR2GRAY というフラグはもし順番がR,G,Bになっているのであれば COLOR_RGB2GRAY という名前にしただろうと思います。つまりそういうことではないでしょうか。レナの画像だとわかりにくいですが、真っ赤、真っ青などの単純画像を読み込ませると納得できると思います。多分！

physics303

2018/05/14 11:27

ありがとうございますorz..

行動規範の内容に同意します

Pythonはわからないけども、RGBじゃなくBGRだから、
Y=0.299195+0.587111+0.114*74=131.898
な、だけじゃないでしょうか？

投稿2018/05/14 11:01

Wind

総合スコア442

physics303

2018/05/14 11:06

ものすごい恥ずかしいのですが、カラー画像で各ピクセルに割り当てられる数字は(R,G,B)ではなく(B,G,R)なのでしょうか？

Wind

2018/05/14 11:39

Jpegの様な圧縮ファイルだとわかり辛いですが、非圧縮なBitmapだと、基本的にB,G,Rの順番で格納されます。ペイント等で24bitBitmapに変換して、バイナリエディタで画像領域を見ると、よくわかります。

yohhoy

2018/05/18 11:21 編集

FIY: BGR順を用いるのはWindowsとOpenCVの歴史的な事情ですね。他システムでは素直なRGBも見受けられます。 https://www.learnopencv.com/why-does-opencv-use-bgr-color-format/

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

openCVにおいてグレースケールに変換する際に何が起きているのか。

前提

疑問

関連した質問