質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

647閲覧

大津の二値化を流用した閾値設定

rmiurmiu

総合スコア1

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2023/01/31 04:49

前提

Pythonで二群間を最大に分離する閾値設定をしたいです。
0から256でヒストグラムを作製し、最も2群を分離する値を、クラス間分散が最大とする値を閾値として設定します。
初心者のもので、まったくなにからまちがえたかがわかりません。

実現したいこと

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

Python

1import cv2 2import numpy as np 3import pandas as pd 4import matplotlib.pyplot as plt 5 6 7#大津の手法 8def threshold_otsu(data, min_value=0, max_value=255): 9 10 11 #ヒストグラムの算出 12 hist = [np.sum(data==i) for i in range(256)] 13 14 s_max=(0,-10) 15 16 for th in range(256): 17 18 # クラス1とクラス2の画素数を計算 19 n1 = sum(hist[:th]) 20 n2 = sum(hist[th:]) 21 22 23 # クラス1とクラス2の画素値の平均を計算 24 if n1 == 0 : mu1 = 0 25 else : mu1 = sum([i * hist[i] for i in range(0,th)]) / n1 26 if n2 == 0 : mu2 = 0 27 else : mu2 = sum([i * hist[i] for i in range(th, 256)]) / n2 28 29 30 # クラス間分散の分子を計算 31 s = n1 * n2 * (mu1 - mu2) ** 2 32 33 # クラス間分散の分子が最大のとき、クラス間分散の分子と閾値を記録 34 if s > s_max[1]: 35 s_max = (th, s) 36 37 # クラス間分散が最大のときの閾値を取得 38 t = s_max[0] 39 40 #cv2.imwrite() 41 print(t) 42 43 return data 44 45 46#ヒストグラム化するデータの読み込み 47 48data = pd.read_csv("random2line.csv") 49df=pd.read_csv("random2line.csv", header=None) 50data=df.values[:,1:] 51 52plt.hist(data, bins=256) 53plt.savefig("C:\pythonlab\lab\output.jpg") 54plt.show() 55 56th = threshold_otsu(data) 57 58 59#出力 600 61

備考

二群間を分離する値が0なわけはないのですが、0になってしまいます。

用いているデータは

12
0~100155~255

でそれぞれ1000個ずつランダムに作成した数字を用いています。
この2群を最大に分離する閾値を求めたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2023/01/31 05:37

大津の二値化、というのはいったいなんでしょうか。 詳しく説明しましょう
guest

回答1

0

ベストアンサー

dataが整数でない場合次のようにして解決可能です.

diff

1- hist = [np.sum(data==i) for i in range(256)] 2+ hist, bins = np.histogram(data, bins = 256)

ちなみに提示した値域で一様分布を作成したところ101で閾値が導出されました.

投稿2023/01/31 05:51

PondVillege

総合スコア1579

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rmiurmiu

2023/01/31 14:26

解決しました! ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問