前提・実現したいこと
scikit-learnのプログラムで、GridSearchCVで正常動作しているプログラムをRandomizedSearchCVでランダムサーチを行いたいと思いますが、以下のプログラムでエラーが出ます。リスト中のRandomizedSearchCVをGridSearchCVにするだけとレクチャーを受けたのですが、何が原因でしょうか。
発生している問題・エラーメッセージ
AttributeError Traceback (most recent call last)
<ipython-input-1-49fd86c761d0> in <module>
27 kfold_cv = KFold(n_splits=5, shuffle=True)
28 clf = RandomizedSearchCV( SVC(), parameters, cv=kfold_cv)
---> 29 clf.fit(x_train, y_train)
30 print("最適なパラメータ = ", clf.best_estimator_)
31
~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in fit(self, X, y, groups, **fit_params)
720 return results_container[0]
721
--> 722 self._run_search(evaluate_candidates)
723
724 results = results_container[0]
~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in _run_search(self, evaluate_candidates)
1513 evaluate_candidates(ParameterSampler(
1514 self.param_distributions, self.n_iter,
-> 1515 random_state=self.random_state))
~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in evaluate_candidates(candidate_params)
694
695 def evaluate_candidates(candidate_params):
--> 696 candidate_params = list(candidate_params)
697 n_candidates = len(candidate_params)
698
~\Anaconda3\lib\site-packages\sklearn\model_selection_search.py in iter(self)
255 # in this case we want to sample without replacement
256 all_lists = np.all([not hasattr(v, "rvs")
--> 257 for v in self.param_distributions.values()])
258 rnd = check_random_state(self.random_state)
259
AttributeError: 'list' object has no attribute 'values'
該当のソースコード
pythonソースコード
1 2 3import pandas as pd 4from sklearn.model_selection import train_test_split 5from sklearn.svm import SVC 6from sklearn.metrics import accuracy_score 7from sklearn.model_selection import KFold 8from sklearn.model_selection import RandomizedSearchCV 9 10 11# アヤメデータの読み込み 12iris_data = pd.read_csv("iris.csv", encoding="utf-8") 13 14# アヤメデータをラベルと入力データに分離する 15y = iris_data.loc[:,"Name"] 16x = iris_data.loc[:,["SepalLength","SepalWidth","PetalLength","PetalWidth"]] 17 18# 学習用とテスト用に分離する 19x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, train_size = 0.8, shuffle = True) 20 21# グリッドサーチで利用するパラメータを指定 --- (*1) 22parameters = [ 23 {"C": [1, 10, 100, 1000], "kernel":["linear"]}, 24 {"C": [1, 10, 100, 1000], "kernel":["rbf"], "gamma":[0.001, 0.0001]}, 25 {"C": [1, 10, 100, 1000], "kernel":["sigmoid"], "gamma": [0.001, 0.0001]} 26] 27 28# グリッドサーチを行う --- (*2) 29kfold_cv = KFold(n_splits=5, shuffle=True) 30clf = RandomizedSearchCV( SVC(), parameters, cv=kfold_cv) 31clf.fit(x_train, y_train) 32print("最適なパラメータ = ", clf.best_estimator_) 33 34# 最適なパラメータで評価 --- (*3) 35y_pred = clf.predict(x_test) 36print("評価時の正解率 = " , accuracy_score(y_test, y_pred))
回答1件
あなたの回答
tips
プレビュー