前提・実現したいこと
不均衡データに対してGradientBoostingを用いた分類予測を行いたいと考えています。
発生している問題・エラーメッセージ
データの数により重み付けを行いたいと考えていますが、class_weightなどの指定ができず困っています。
例えば、sklearnでSVM使用の場合はclass_weightが指定できるかと思います。
GradientBoostingを使用する場合は、どのようにすればよいかご教示頂きたいです。
該当のソースコード
from sklearn.ensemble import GradientBoostingClassifier from sklearn.grid_search import GridSearchCV model = GradientBoostingClassifier(n_estimators=3000,) parameters = {'learning_rate' : [0.1, 0.05, 0.02, 0.01], 'max_depth': [4, 6, 10, None], 'min_samples_leaf': [3, 5, 9, 17], 'max_features': [1.0, 0.3, 0.1,"auto",None]} gscv = GridSearchCV(model, parameters, verbose=3, n_jobs=-1, cv=3) gscv.fit(X_train, y_train) print("best score=", gscv.best_score_) y_pred = gscv.best_estimator_.predict(X_test) conf_mat = confusion_matrix(y_test,y_pred) conf_mat
試したこと
データ数による重み付けなしで、グリッドサーチによるチューニングとテストデータの予測、混同行列の算出までを行いました。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。