大津の手法を用いて3値化を行う

実現したいこと

大津の2値化を拡張して，3値化を行いたい

前提

Pythonを用いて，大津の手法を実装しています。閾値の決定方法のみ，ライブラリを使わずにクラス間分散を最大にするやり方で行っています。参考論文はこちらにあります。https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4310076

発生している問題

エラーは出ませんが，二つ目の閾値がうまく計算できていないようです。
一つ目の閾値はおそらく正しいです(二値化だけで実装した時と同じになったため)。結果を見たところ，画像を変えても二つ目の閾値がほぼ250付近のかなり高い画素値に設定されてしまっています。

該当のソースコード

Python
1
2import numpy as np
3import matplotlib.pyplot as plt
4import cv2
5
6def otsu_threshold(image):
7    # グレースケール変換
8    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
9
10    # 画像の総画素数
11    total_pixels = gray.shape[0] * gray.shape[1]
12
13    # ヒストグラムの計算
14    hist = np.histogram(gray, bins=256, range=[0, 256])[0] / total_pixels
15    #plt.figure()
16    #plt.plot(hist)
17
18    all_sum = np.sum(hist * np.arange(256))
19    all_mean = all_sum / total_pixels
20
21    # クラス間分散と閾値の初期化
22    max_variance = 0
23    threshold1 = 0
24    threshold2 = 0
25
26    # 0から255までの閾値を試す
27    for t1 in range(256):
28        for t2 in range(t1+1, 255):
29            # クラス1とクラス2の画素数を計算(wに相当)
30            class1_pixels = np.sum(hist[:t1])
31            class2_pixels = np.sum(hist[t1:t2])
32            class3_pixels = total_pixels - (class1_pixels + class2_pixels)
33
34            # クラス1とクラス2の画素値の総和を計算
35            class1_sum = np.sum(hist[:t1] * np.arange(t1))
36            class2_sum = np.sum(hist[t1:t2] * np.arange(t1, t2))
37            class3_sum = np.sum(hist[t2:] * np.arange(t2, 256))
38
39            # クラス1とクラス2の平均を計算
40            class1_mean = class1_sum / class1_pixels if class1_pixels > 0 else 0
41            class2_mean = class2_sum / class2_pixels if class2_pixels > 0 else 0
42            class3_mean = class3_sum / class3_pixels if class3_pixels > 0 else 0
43
44            # クラス間分散を計算
45            #variance = class1_pixels * class2_pixels * ((class1_mean - class2_mean) ** 2)
46            variance = class1_pixels * (class1_mean - all_mean)**2 + class2_pixels * (class2_mean - all_mean)**2 + class3_pixels * (class3_mean - all_mean)**2
47
48            # クラス間分散が最大となる閾値を更新
49            if variance > max_variance:
50                max_variance = variance
51                threshold1 = t1
52                threshold2 = t2
53
54    print("threshold = {0},{1}".format(threshold1, threshold2))
55    # 3値化処理
56    #binary_image = np.where(gray > threshold, 255, 0).astype(np.uint8)
57    binary_image = np.zeros_like(gray)
58    binary_image[gray <= threshold1] = 0
59    binary_image[(gray > threshold1) & (gray <= threshold2)] = 127
60    binary_image[gray > threshold2] = 255
61
62    return binary_image
63
64# 画像の読み込み
65image = cv2.imread("const.jpg")
66
67# 大津の二値化
68binary_image = otsu_threshold(image)
69
70# 結果の表示
71plt.figure(figsize=(10, 5))
72plt.subplot(1, 2, 1)
73plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
74plt.title('Original Image')
75plt.axis('off')
76
77plt.subplot(1, 2, 2)
78plt.imshow(binary_image, cmap='gray', vmin=0, vmax=255)
79plt.title('Otsu Thresholding')
80plt.axis('off')
81
82plt.tight_layout()
83plt.show()

試したこと

いろんな画像を入れてみましたが，どれも同じで，二つ目の閾値が非常に高い値になりました。
式の確認などは何度も行ってるので合っているとは思います。

お力添えいただけますと幸いです。よろしくお願い致します。

winterboum

2023/07/09 02:59

プログラムはきちんと追いかけて居ませんが、 > 一つ目の閾値はおそらく正しいです(二値化だけで実装した時と同じになったため)。が？？？。。。。。。。。。。。｜。。。。。。。。。。。。。 ⇐ 2値化。。。。。。。｜。。。。。。。。。。。｜。。。。。。 ⇐ ３値化だと思うので、「二値化だけで実装した時よりちいさい」のでは？

ikedas

2023/07/09 06:02

> for t1 in range(256): > for t2 in range(t1+1, 255): ですが、 | for t1 in range(255): | for t2 in range(t1+1, 256): のほうがよいのではないでしょうか。それと、0→255の順で調べていますが、255→0でも同じ結果になるのだろうか、というのが気になりました。2値ならなりそうですが。

winterboum

2023/07/09 08:17

３値でも同じにならないとおかしいですよね。 class間の分散を最大にする、のですから。

ikedas

2023/07/09 08:24

そうなのかもしれません。 > However, they are very simple for M = 2 and 3, (...), so that a special method to reduce the search processes is hardly needed. (p.64) で、"never" ではなく "hardly" と言っているのが気になったもので。

winterboum

2023/07/09 09:58

？？引用されてるところだけ、、ですとプロセスを単純化するのは難しいですよね？逆から計算しても同じかというのと関係ある？

ikedas

2023/07/09 11:06

(hardではなくhardlyですがそれはおいといて) ヒストグラムに複数の山があったらどうなる? とか考えていました。classが4以上ならどこから調べ始めるかで結果が変わることがあるのは想像がつきますが、3ではどうかなー、と。

winterboum

2023/07/09 13:28

え？山が複数有るときclass が 4 以上だと方向で変わりますか？境界値を動かすと classの点の数も分散も単純に増減しますよね。傾きは山か谷かで変わりますが。 4classのとき、3つの境界値 x,y,z に対してクラス間分散をplotしたとき、同じ分散になるのは山ほど出ると思いますが、同じ高さのpeakが複数出てくる、それも最大高さのpeakが、というのはイメージできない。。。頭硬くなったな。あ？分散は単純な増減にならない？一番左の境界が右に行くと左のclass １は点の数は増え、平均値も増える。平均値の差は減る。減り方と増え方のバランスで、分散は増えたり減ったりしうるか。。。。感覚では捉えきれなくなりました。降参。

行動規範の内容に同意します

回答1件

histがtotal_pixelsで割られていて正規化されているので、
下記の最後の行は、

python
1class1_pixels = np.sum(hist[:t1])
2class2_pixels = np.sum(hist[t1:t2])
3class3_pixels = total_pixels - (class1_pixels + class2_pixels)

total_pixelsではなく、1から引かないといけないと思います。

python
1class3_pixels = 1.0 - (class1_pixels + class2_pixels)

投稿2023/07/09 07:56

bsdfan

総合スコア4921

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

大津の手法を用いて3値化を行う

実現したいこと

前提

発生している問題

該当のソースコード

試したこと

関連した質問