質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1454閲覧

Python SVMについて

asddsa

総合スコア20

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/04/12 08:17

編集2018/04/12 09:23

PythonのSVMについて

SVMで確率を算出した場合は(svm.SVC(probability=True))を使うと思うのですが、

データAで学習、データBで予測を10回繰り返したところ、確率の出力結果(予測結果)が毎回異なります。

なぜでしょうか。よろしくお願いします。

以下、コードです。

import numpy as np
from sklearn import svm

for x in range(0, 10):
auc = []
X = np.array([[-3,-2],
[-1,0],
[-4,2],
[3,1],
[4,-1],
[-1,0],
[-2,-5],
[3,5],
[10,1],
[0,1]])

y = np.array([0,0,0,1,1,0,0,1,1,1]) skf = StratifiedKFold(n_splits=3, random_state = 42) for train, test in skf.split(X, y): clf = svm.SVC(probability=True) clf.fit(X[train], y[train]) predict = clf.predict_proba(X[test])[:,1] auc.append(roc_auc_score(y[test], predict)) print(np.array(auc).mean())

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

データAで学習、データBで予測を10回繰り返した

これは学習と予測を10セットやったという意味ですか? それとも1回学習して10回予測ですか?
前者なら、random_state=0を指定してみてください。

解決について

解決方法:SVCのオプションのrandom_stateを指定したところ、結果が変化しなくなった。

SVCのオプションのrandom_stateですが、ドキュメントによると

random_state : int, RandomState instance or None, optional (default=None)

The seed of the pseudo random number generator to use when shuffling the data. If int, random_state is the seed used by the random number generator; If RandomState instance, random_state is the random number generator; If None, the random number generator is the RandomState instance used by np.random.

sklearn.svm.SVC — scikit-learn 0.19.1 documentation

データのシャッフルに用いているそうです。

SVMのアルゴリズムで用いているのか、predict_probaで用いる交差検証の際に使われるだけなのかまでは不勉強なのでよくわかりません(でもシャッフルってことは後者?)。

投稿2018/04/12 08:35

編集2018/04/12 09:36
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

asddsa

2018/04/12 09:02

ご回答ありがとうございます。 学習と予測を10セットをrandom_state=42でやっております
hayataka2049

2018/04/12 09:17

手元で確認したところ、random_state指定なしでは再現、指定ありでは未再現(結果の変化なし)でした。データA,Bが同じものであれば、変わる理由は思いつきません・・・
asddsa

2018/04/12 09:23

コードを書いてみたのですが、どうでしょうか
hayataka2049

2018/04/12 09:27

わかりました。「SVCの」random_stateを指定してください。それで同じ結果になるはずです。
asddsa

2018/04/12 09:35 編集

なるほど そういうことでしたか。 ありがとうございました。 ちなみになのですが、再現、未再現とはどういうことなのでしょうか。
asddsa

2018/04/12 09:41

なるほど!ありがとうございました
asddsa

2018/04/12 15:47

ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問