編集履歴

回答編集履歴

追記

2018/09/20 10:49

投稿

スコア21960

answer CHANGED Viewed

@@ -1,11 +1,5 @@
-```
-cv2.cvtColor(image_bgr, cv2.COLOR_BGR2LAB)
-を使うと、クラスタリングで色を取得したあとになぜかRGBAに変換されてしまうので、
+## 各チャンネルの可視化
-```
-BGR 色空間から LAB 色空間に変換するには、上記でよいはずですが、「クラスタリングで色を取得したあとになぜかRGBAに変換されてしまう」とはどういう処理のことを言っていますか？
 ```python
 import cv2
 import matplotlib.pyplot as plt
@@ -31,11 +25,6 @@
 ch_imgs = cv2.split(lab_img)
 labels = ['L', 'a', 'b']
 draw_each_channel(ch_imgs, labels)
-# リサイズした LAB 画像をチャンネルごとに表示する。
-ch_imgs = cv2.split(resized)
-labels = ['L', 'a', 'b']
-draw_each_channel(ch_imgs, labels)
 ```
 BGR 画像
@@ -44,5 +33,85 @@
 LAB 画像
 ![イメージ説明](c59d63d2aa2cb1a005a583e4800a1392.png)
+## 質問の内容 Lab 色空間の値の範囲について
+```
+クラスタリングで色を取得したあとになぜかRGBAに変換されてしまうので、
+```
+クラスタリングは関係ありません。
+オリジナルの Lab 色空間の各チャンネルの値の範囲は以下ですが、
-リサイズした LAB 画像
+L: [0, 100]
+a: [-127, 127]
+b: [-127, 127]
+`cv2.cvtColor()` で変換した際は、値の範囲はすべて [0, 255] になるように補正されます。[OpenCV リファレンス](https://docs.opencv.org/3.3.0/de/d25/imgproc_color_conversions.html) を参考にしてください。
+補正する理由は、OpenCV の多くの関数は画像の型は uint8 を期待するため、int 型であると不便だからだと思います。
+元の範囲で得たい場合は、補正と逆の変換を行えばよいです。算出の式は [OpenCV リファレンス](https://docs.opencv.org/3.3.0/de/d25/imgproc_color_conversions.html) にのっています。
+```python
+def draw_each_channel_hist(ch_imgs, labels, bins_list):
+    fig, axes_list = plt.subplots(1, 3, figsize=(10, 3))
+    for axes, ch_img, label, bins in zip(axes_list, ch_imgs, labels, bins_list):
+        axes.set_title(label)
+        axes.hist(ch_img.flatten(), bins=bins, density=True)
+    plt.show()
+# cv2.COLOR_Lab2BGR 直後の Lab 画像
+ch_imgs = cv2.split(lab_img)
+bins_list = [np.arange(256), np.arange(256), np.arange(256)]
+draw_each_channel_hist(ch_imgs, ['L', 'a', 'b'], bins_list)
+# cv2.COLOR_Lab2BGR で最後に [0, 255] に範囲が補正されるので元に戻す、
+# L_d := L * 255 / 100 <-> L = L_d * 100 / 255
+# a_d := a + 128 <-> a = a_d - 128
+# b_d := b + 128 <-> b = b_d - 128
+lab_img2 = lab_img.astype(np.float)
+lab_img2[:, :, 0] *= 100 / 255  # L の範囲を [0, 100] に戻す。
+lab_img2[:, :, 1] -= 128  # L の範囲を [-127, 127] に戻す。
+lab_img2[:, :, 2] -= 128  # L の範囲を [-127, 127] に戻す。
+lab_img2 = lab_img2.astype(np.int)
+# cv2.COLOR_Lab2BGR 直後の Lab 画像
+ch_imgs = cv2.split(lab_img2)
+bins_list = [np.arange(101), np.arange(-127, 128), np.arange(-127, 128)]
+draw_each_channel_hist(ch_imgs, ['L', 'a', 'b'], bins_list)
+```
-![イメージ説明](37a14ef2e14699832e9eeba7aba39e09.png)
+![イメージ説明](ed36867d25140aa8b7993a5ff6be2e3f.png)
+![イメージ説明](ce3603e89127499621e8341b48c11376.png)
+## ラベル画像作成
+PIL や matplotlib など多くのライブラリでも、色は [0, 255] の範囲であることを前提としているので、[]0, 255] に補正したままのほうがよさそうです。
+```
+# k-平均クラスタリングを行う。
+kmeans = KMeans(n_clusters=3)
+kmeans.fit(lab_img.reshape(-1, 3))
+# ラベル一覧及び各ラベルの個数を取得する。
+unique, counts = np.unique(kmeans.labels_, return_counts=True)
+rates = counts / counts.sum()  # 各ラベルの割合
+# 画像を作成する。
+height, width = 50, 300  # 画像の大きさ
+bar_img = np.empty((height, 0, 3), dtype=np.uint8)
+for color, rate in zip(clt.cluster_centers_, rates):
+    bar_width = int(rate * width)
+    bar = np.full((height, bar_width, 3), color, dtype=np.uint8)
+    bar_img = np.hstack([bar_img, bar])
+    print('color: {}, rate: {:.2f}'.format(color, rate))
+# color: [168.23241035 106.80193675 180.55651384], rate: 0.37
+# color: [ 89.67927036 110.89743899 153.16863977], rate: 0.32
+# color: [208.73413897 112.50177328 172.6562459 ], rate: 0.31
+plt.imshow(bar_img)
+plt.axis('off')
+plt.show()
+```
+![イメージ説明](17bde1156d45d617d693a5a864222ced.png)