質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

3830閲覧

python機械学習のROC曲線, AUC

mokomo10

総合スコア6

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2017/12/20 16:15

Pythonによる機械学習入門を読み進んでいます。
p127 6.4.2の学習と評価について, classify_handsign_2.pyを実行するとそれぞれのテスト用画像のprecision,recall,f1-scoreなどが表示されます。
スクリプトを以下のように実行する。

>>>run classify_handsign_2.py 4 ./data/m01 ./data/m05 ./data/m06 ./data/m07 ./data/m02 ./data/m03 ./data/m04 ./data/m08 ./data/m09 ./data/m10 ./data/m11 ./data/m12 ./data/m13 ./data/m14 ./data/m15 ./data/m16

しかし、この場合のそれぞれのROC曲線,AUCはどのようなコードにすれば表示させることができるのですか?
厚かましいお願いではございま‌​すが、よろしくお願いします。
コードは以下の通りです。

import os import sys import glob import numpy as np from skimage import io from sklearn import datasets IMAGE_SIZE = 40 COLOR_BYTE = 3 CATEGORY_NUM = 6 ## ラベル名(0~)を付けたディレクトリに分類されたイメージファイルを読み込む ## 入力パスはラベル名の上位のディレクトリ def load_handimage(path): # ファイル一覧を取得 files = glob.glob(os.path.join(path, '*/*.png')) # イメージとラベル領域を確保 images = np.ndarray((len(files), IMAGE_SIZE, IMAGE_SIZE, COLOR_BYTE), dtype = np.uint8) labels = np.ndarray(len(files), dtype=np.int) # イメージとラベルを読み込み for idx, file in enumerate(files): # イメージ読み込み image = io.imread(file) images[idx] = image # ディレクトリ名よりラベルを取得 label = os.path.split(os.path.dirname(file))[-1] labels[idx] = int(label) # scikit-learn の他のデータセットの形式に合わせる flat_data = images.reshape((-1, IMAGE_SIZE * IMAGE_SIZE * COLOR_BYTE)) images = flat_data.view() return datasets.base.Bunch(data=flat_data, target=labels.astype(np.int), target_names=np.arange(CATEGORY_NUM), images=images, DESCR=None) #####################################= from sklearn import svm, metrics ## usage: ## python classify_handsign_1.py <n> <dir_1> <dir_2> ... <dir_m> ## n テスト用データディレクトリ数 ## dir_1 データディレクトリ1 ## dir_m データディレクトリm if __name__ == '__main__': argvs = sys.argv # 評価用ディレクトリ数の取得 paths_for_test = argvs[2:2+int(argvs[1])] paths_for_train = argvs[2+int(argvs[1]):] print('test ', paths_for_test) print('train', paths_for_train) # 学習データの読み込み data = [] label = [] for i in range(len(paths_for_train)): path = paths_for_train[i] d = load_handimage(path) data.append(d.data) label.append(d.target) train_data = np.concatenate(data) train_label = np.concatenate(label) # 手法:線形SVM classifier = svm.LinearSVC() # 学習 classifier.fit(train_data, train_label) for path in paths_for_test: # テストデータの読み込み d = load_handimage(path) # テスト predicted = classifier.predict(d.data) # 結果表示 print("### %s ###" % path) print("Accuracy:\n%s" % metrics.accuracy_score(d.target, predicted)) print("Classification report:\n%s\n" % metrics.classification_report(d.target, predicted))

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

投稿2017/12/20 17:51

mkgrei

総合スコア8560

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問