前提
Pythonで二群間を最大に分離する閾値設定をしたいです。
0から256でヒストグラムを作製し、最も2群を分離する値を、クラス間分散が最大とする値を閾値として設定します。
初心者のもので、まったくなにからまちがえたかがわかりません。
実現したいこと
発生している問題・エラーメッセージ
エラーメッセージ
該当のソースコード
Python
1import cv2 2import numpy as np 3import pandas as pd 4import matplotlib.pyplot as plt 5 6 7#大津の手法 8def threshold_otsu(data, min_value=0, max_value=255): 9 10 11 #ヒストグラムの算出 12 hist = [np.sum(data==i) for i in range(256)] 13 14 s_max=(0,-10) 15 16 for th in range(256): 17 18 # クラス1とクラス2の画素数を計算 19 n1 = sum(hist[:th]) 20 n2 = sum(hist[th:]) 21 22 23 # クラス1とクラス2の画素値の平均を計算 24 if n1 == 0 : mu1 = 0 25 else : mu1 = sum([i * hist[i] for i in range(0,th)]) / n1 26 if n2 == 0 : mu2 = 0 27 else : mu2 = sum([i * hist[i] for i in range(th, 256)]) / n2 28 29 30 # クラス間分散の分子を計算 31 s = n1 * n2 * (mu1 - mu2) ** 2 32 33 # クラス間分散の分子が最大のとき、クラス間分散の分子と閾値を記録 34 if s > s_max[1]: 35 s_max = (th, s) 36 37 # クラス間分散が最大のときの閾値を取得 38 t = s_max[0] 39 40 #cv2.imwrite() 41 print(t) 42 43 return data 44 45 46#ヒストグラム化するデータの読み込み 47 48data = pd.read_csv("random2line.csv") 49df=pd.read_csv("random2line.csv", header=None) 50data=df.values[:,1:] 51 52plt.hist(data, bins=256) 53plt.savefig("C:\pythonlab\lab\output.jpg") 54plt.show() 55 56th = threshold_otsu(data) 57 58 59#出力 600 61
備考
二群間を分離する値が0なわけはないのですが、0になってしまいます。
用いているデータは
1 | 2 |
---|---|
0~100 | 155~255 |
でそれぞれ1000個ずつランダムに作成した数字を用いています。
この2群を最大に分離する閾値を求めたいです。
回答1件