3つ以上のハイパラチューニングのスコアの視覚化

夜分遅くにすいません
ハイパワーパラーメータチューニングの選出法について悩んでいます。
例えばBaggingClassifier()において


from sklearn.ensemble import BaggingClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection = train_test_split

cancer = load_breast_cancer()
x_train, x_test, y_train,y_test = train_test_split(cancer.data,cancer.target)

param_grid = {
    'max_features':[1,2,3,4,5],
    'max_samples':[1,2,3,4,5],
    'n_estimators':[2,5,10,20,50,100],
}

というような３つのハイパーパラメータをチューニングする場合


gs = GridSearchCV(
    estimator = BaggingClassifier(),
    param_grid = param_grid,
    cv=5
)
gs.fit(x_train,y_train)
gs.best_params_
>> {'max_features': 2, 'max_samples': 5, 'n_estimators': 100}

というように一番スコアがよかったハイパラのセットは抽出できたのですが、ベストだけではなく、その前後なども含めて段階的にみるためにヒートマップにプロットしようとしました。

import itertools
import seaborn as sns
params = [k for k in gs.cv_results_.keys() if k.startswith('param_')]
params
for ele1, ele2 in itertools.combinations(params,2):

  print(ele1,',',ele2)
  index = ele1
  columns = ele2
  values=  'mean_test_score'
  # {ele} 
  params_dict = {k: gs.cv_results_[k] for k in {index, columns, values}}
  params_df = pd.DataFrame(params_dict)
  params_pivot = params_df.pivot(index=index,columns=columns,values=values)
  sns.heatmap(params_pivot)

しかしヒートマップは２軸対応らしくて

>> ValueError: Index contains duplicate entries, cannot reshape

というエラーがでました。
３や５つなどなどのハイパーパラメータも試したいのですがどのように視覚化して確かめるのがよいでしょうか。

行動規範の内容に同意します

回答1件

一般的な回答はありませんが、この問題に限定してやりようはあります。

3つのハイパーパラメータが、離散的かつ取りうる値が少ないですので、**「max_features × max_samples の 5×5のヒートマップ」を「n_estimatorsごとに6種類並べる」**のが近道です。

3つのハイパーパラメータが連続的な場合、上記を応用して、2次元ヒートマップを細かくたくさん作り、GIFアニメっぽく表現するのも面白いかもしれません。

投稿2021/02/07 07:12

toast-uz

総合スコア3266

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

3つ以上のハイパラチューニングのスコアの視覚化

関連した質問