質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

3879閲覧

GridSearchCVをRandomizedSearchCVへの変更でエラー

DellDell

総合スコア13

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/01/25 04:50

前提・実現したいこと

scikit-learnのプログラムで、GridSearchCVで正常動作しているプログラムをRandomizedSearchCVでランダムサーチを行いたいと思いますが、以下のプログラムでエラーが出ます。リスト中のRandomizedSearchCVをGridSearchCVにするだけとレクチャーを受けたのですが、何が原因でしょうか。

発生している問題・エラーメッセージ

AttributeError Traceback (most recent call last)
<ipython-input-1-49fd86c761d0> in <module>
27 kfold_cv = KFold(n_splits=5, shuffle=True)
28 clf = RandomizedSearchCV( SVC(), parameters, cv=kfold_cv)
---> 29 clf.fit(x_train, y_train)
30 print("最適なパラメータ = ", clf.best_estimator_)
31

~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in fit(self, X, y, groups, **fit_params)
720 return results_container[0]
721
--> 722 self._run_search(evaluate_candidates)
723
724 results = results_container[0]

~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in _run_search(self, evaluate_candidates)
1513 evaluate_candidates(ParameterSampler(
1514 self.param_distributions, self.n_iter,
-> 1515 random_state=self.random_state))

~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in evaluate_candidates(candidate_params)
694
695 def evaluate_candidates(candidate_params):
--> 696 candidate_params = list(candidate_params)
697 n_candidates = len(candidate_params)
698

~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in iter(self)
255 # in this case we want to sample without replacement
256 all_lists = np.all([not hasattr(v, "rvs")
--> 257 for v in self.param_distributions.values()])
258 rnd = check_random_state(self.random_state)
259

AttributeError: 'list' object has no attribute 'values'

該当のソースコード

pythonソースコード

1 2 3import pandas as pd 4from sklearn.model_selection import train_test_split 5from sklearn.svm import SVC 6from sklearn.metrics import accuracy_score 7from sklearn.model_selection import KFold 8from sklearn.model_selection import RandomizedSearchCV 9 10 11# アヤメデータの読み込み 12iris_data = pd.read_csv("iris.csv", encoding="utf-8") 13 14# アヤメデータをラベルと入力データに分離する 15y = iris_data.loc[:,"Name"] 16x = iris_data.loc[:,["SepalLength","SepalWidth","PetalLength","PetalWidth"]] 17 18# 学習用とテスト用に分離する 19x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, train_size = 0.8, shuffle = True) 20 21# グリッドサーチで利用するパラメータを指定 --- (*1) 22parameters = [ 23 {"C": [1, 10, 100, 1000], "kernel":["linear"]}, 24 {"C": [1, 10, 100, 1000], "kernel":["rbf"], "gamma":[0.001, 0.0001]}, 25 {"C": [1, 10, 100, 1000], "kernel":["sigmoid"], "gamma": [0.001, 0.0001]} 26] 27 28# グリッドサーチを行う --- (*2) 29kfold_cv = KFold(n_splits=5, shuffle=True) 30clf = RandomizedSearchCV( SVC(), parameters, cv=kfold_cv) 31clf.fit(x_train, y_train) 32print("最適なパラメータ = ", clf.best_estimator_) 33 34# 最適なパラメータで評価 --- (*3) 35y_pred = clf.predict(x_test) 36print("評価時の正解率 = " , accuracy_score(y_test, y_pred))

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hayataka2049

2019/01/25 04:52

一番最後に``` の行を入れないとシンタックスハイライト・マークダウン(コードブロック)として解釈されませんので、修正しておいてください
DellDell

2019/01/25 04:59

修正依頼ありがとうございました。初めてですので、よろしくお願いいたします。
guest

回答1

0

ベストアンサー

どうもclf = RandomizedSearchCV( SVC(), parameters, cv=kfold_cv)の第二引数が怪しいっぽいな、という目星はなんとなくつくと思います。こういうときはリファレンスを見ます。

param_grid : dict or list of dictionaries

sklearn.model_selection.GridSearchCV — scikit-learn 0.20.2 documentation

 

param_distributions : dict

sklearn.model_selection.RandomizedSearchCV — scikit-learn 0.20.2 documentation

はい、仕様が違います。詳細は上のリンクを読んでいただけば書いてあるので端折りますけれども、GridSearchCVは辞書かリスト(辞書が要素のリスト)を取るけどRandomizedSearchCVの方は辞書しか取らない、という違いがありますね。

最初からGridSearchCVの方に辞書を渡していれば同じ辞書でいけますが、リストを渡していた場合は駄目ということです。こういう場合、同じニュアンスのコードのまま置き換えるのは難しいかもしれません。どうしたら良いのかは、レクチャーしてくれた人に聞いてみると良いと思います。

投稿2019/01/25 04:59

編集2019/01/25 05:03
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

DellDell

2019/01/25 05:03

ご教授ありがとうございました。大変勉強になりました。レクチャーしてくれた方に連絡を取って確認してみます。ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問