LightGBMを使用して分類をさせようとしています。
f値で性能を評価したいのですが、print(f1_score(,))の中には何が入るのでしょうか。
ご教授お願い致します。
python
1import lightgbm as lgb 2from sklearn.metrics import confusion_matrix 3from sklearn.metrics import accuracy_score 4 5X, y = df_concat.iloc[:1248, [0, 2, 3, 4]], df_concat.iloc[:1248, 5] 6 7# データをホールドアウト法で分割 8x_train, x_test, y_train, y_test = train_test_split(X, y,test_size=0.3,shuffle=True,stratify=y) 9 10 11# データセットを登録 12lgb_train = lgb.Dataset(x_train, y_train) 13lgb_test = lgb.Dataset(x_test, y_test, reference=lgb_train) 14 15 16# LightGBMのハイパーパラメータを設定 17params = {'task': 'train', # タスクを訓練に設定 18 'boosting_type': 'gbdt', # GBDTを指定 19 'objective': 'binary', # 多クラス分類を指定 20 'metric': {'binary_logloss'}, # 多クラス分類の損失(誤差) 21 'num_class': 1, # クラスの数 22 'learning_rate': 0.1, # 学習率 23 'num_leaves': 21, # ノードの数 24 'min_data_in_leaf': 3, # 決定木ノードの最小データ数 25 'num_iteration': 100} # 予測器(決定木)の数:イタレーション 26 27lgb_results = {} # 学習の履歴を入れる入物 28model = lgb.train(params=params, # ハイパーパラメータをセット 29 train_set=lgb_train, # 訓練データを訓練用にセット 30 valid_sets=[lgb_train, lgb_test], # 訓練データとテストデータをセット 31 valid_names=['Train', 'Test'], # データセットの名前をそれぞれ設定 32 num_boost_round=500, # 計算回数 33 early_stopping_rounds=10, # アーリーストッピング設定 34 evals_result=lgb_results) # 履歴を保存する 35 36loss_train = lgb_results['Train']['binary_logloss'] # 訓練誤差 37loss_test = lgb_results['Test']['binary_logloss'] # 汎化誤差 38best_iteration = model.best_iteration # 最良の予測器が得られたイテレーション数 39print(loss_test) 40print(best_iteration) 41 42
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。