PythonでのlightGBMの実装の際にevals

以下サイトを参考にlightGBMの実装を検討しています。
https://watlab-blog.com/2020/04/12/light-gbm/

ですが，LightGBMのハイパーパラメータの設定の際にevals_resultで文法エラーとなります。

python
1#インポート
2import lightgbm as lgb
3from sklearn import datasets
4from sklearn.model_selection import train_test_split
5import pandas as pd
6import numpy as np
7from matplotlib import pyplot as plt
8from sklearn.metrics import mean_squared_error
9from sklearn.model_selection import GridSearchCV
10
11#############################################################################################
12
13# ファイルの読み込みおよびN/Aの削除
14df9 = pd.read_csv(path1, header = 0, index_col = 0, encoding='shift-JIS') 
15df8 = df9.dropna() 
16
17# 分類するクラスの種類と数を確認
18df8['evaluation'].value_counts()
19
20# 訓練用とテスト用に7:3で分割
21train_x = df8.drop(['evaluation'], axis=1)
22train_y = df8['evaluation']
23(train_x, test_x ,train_y, test_y) = train_test_split(train_x, train_y, test_size = 0.3)
24
25
26# LightGBMにデータセットを登録
27lgb_train = lgb.Dataset(train_x, train_y)
28lgb_test = lgb.Dataset(test_x, test_y, reference=lgb_train)
29
30
31# LightGBMのハイパーパラメータを設定
32params = {'task': 'train',              # タスクを訓練に設定
33          'boosting_type': 'gbdt',      # GBDTを指定
34          'objective': 'multiclass',    # 多クラス分類を指定
35          'metric': {'multi_logloss'},  # 多クラス分類の損失（誤差）
36          'num_class': 4,               # クラスの数（irisデータセットが3個のクラスなので）
37          'learning_rate': 0.1,         # 学習率
38          'num_leaves': 21,             # ノードの数
39          'min_data_in_leaf': 3,        # 決定木ノードの最小データ数
40          'num_iteration': 100}         # 予測器(決定木)の数:イタレーション
41
42
43# LightGBMで訓練する
44lgb_results = {}                                    # 学習の履歴を入れる入物
45model = lgb.train(params=params,                    # ハイパーパラメータをセット
46                  train_set=lgb_train,              # 訓練データを訓練用にセット
47                  valid_sets=[lgb_train, lgb_test], # 訓練データとテストデータをセット
48                  valid_names=['Train', 'Test'],    # データセットの名前をそれぞれ設定
49                  num_boost_round=100,              # 計算回数
50                  early_stopping_rounds=10)        # アーリーストッピング設定  
51                  evals_result=lgb_results)         # 履歴を保存する 
52
53# 結果を抽出する
54loss_train = lgb_results['Train']['multi_logloss']  # 訓練誤差
55loss_test = lgb_results['Test']['multi_logloss']    # 汎化誤差
56best_iteration = model.best_iteration               # 最良の予測器が得られたイタレーション数
57print(best_iteration)
58
59############################################################################################
60
61# グラフ描画
62import lightgbm as lgb
63from sklearn import datasets
64from sklearn.model_selection import train_test_split
65import pandas as pd
66from matplotlib import pyplot as plt

解決策をご存じの方いましたらご教示いただけますと幸いです。

行動規範の内容に同意します

回答1件

ベストアンサー

lgb.trainメソッドにおいてearly_stopping_roundsの指定のあとにカッコで閉じているのが原因かと思います。
カンマ(,)に修正すればおそらく動くと思います。

python
1model = lgb.train(params=params,                    
2                  train_set=lgb_train,              
3                  valid_sets=[lgb_train, lgb_test], 
4                  valid_names=['Train', 'Test'],    
5                  num_boost_round=100,              
6                  early_stopping_rounds=10) # ←←←←←ココ
7                  evals_result=lgb_results)