前提
機械学習初学者です。Kaggle・Pythonに関する質問です。
「KAGGLEのチュートリアル【第6版】」を参考にしながらタイタニック問題に取り組んでいます。
実現したいこと
・データを67%:33%の割合でtrainセットとvalidセット(検証用セット)に分割して学習させたい
・循環参照がなぜ、どの部分が問題で出ているのか判明させたい
発生している問題・エラーメッセージ
循環参照が検出されましたと出る(エラーメッセージ最下部)
エラーメッセージ
ValueError Traceback (most recent call last)
/tmp/ipykernel_27/1054045390.py in <module>
13 early_stopping_rounds=20,
14 evals_result=evals_result,
---> 15 verbose_eval=10);
16 #valid_xについて推論
17 oof=(gbm.predict(valid_x)>0.5).astype(int)
/opt/conda/lib/python3.7/site-packages/lightgbm/engine.py in train(params, train_set, num_boost_round, valid_sets, valid_names, fobj, feval, init_model, feature_name, categorical_feature, early_stopping_rounds, evals_result, verbose_eval, learning_rates, keep_training_booster, callbacks)
314 booster.best_score[dataset_name][eval_name] = score
315 if not keep_training_booster:
--> 316 booster.model_from_string(booster.model_to_string(), verbose='_silent_false').free_dataset()
317 return booster
318
/opt/conda/lib/python3.7/site-packages/lightgbm/basic.py in model_to_string(self, num_iteration, start_iteration, importance_type)
3417 ptr_string_buffer))
3418 ret = string_buffer.value.decode('utf-8')
-> 3419 ret += _dump_pandas_categorical(self.pandas_categorical)
3420 return ret
3421
/opt/conda/lib/python3.7/site-packages/lightgbm/basic.py in _dump_pandas_categorical(pandas_categorical, file_name)
617
618 def _dump_pandas_categorical(pandas_categorical, file_name=None):
--> 619 categorical_json = json.dumps(pandas_categorical, default=json_default_with_numpy)
620 pandas_str = f'\npandas_categorical:{categorical_json}\n'
621 if file_name is not None:
/opt/conda/lib/python3.7/json/init.py in dumps(obj, skipkeys, ensure_ascii, check_circular, allow_nan, cls, indent, separators, default, sort_keys, **kw)
236 check_circular=check_circular, allow_nan=allow_nan, indent=indent,
237 separators=separators, default=default, sort_keys=sort_keys,
--> 238 **kw).encode(obj)
239
240
/opt/conda/lib/python3.7/json/encoder.py in encode(self, o)
197 # exceptions aren't as detailed. The list call should be roughly
198 # equivalent to the PySequence_Fast that ''.join() would do.
--> 199 chunks = self.iterencode(o, _one_shot=True)
200 if not isinstance(chunks, (list, tuple)):
201 chunks = list(chunks)
/opt/conda/lib/python3.7/json/encoder.py in iterencode(self, o, _one_shot)
255 self.key_separator, self.item_separator, self.sort_keys,
256 self.skipkeys, _one_shot)
--> 257 return _iterencode(o, 0)
258
259 def _make_iterencode(markers, _default, _encoder, _indent, _floatstr,
ValueError: Circular reference detected
該当のソースコード
Python
1ソースコード 2```import lightgbm as lgb 3from sklearn.model_selection import train_test_split 4from sklearn.metrics import accuracy_score 5#X_trainとy_trainをtrainとvalidに分割 6train_x,valid_x,train_y,valid_y=train_test_split(X_train,y_train,test_size=0.33,random_state=0) 7#lgb.Datasetでtrainとvalidを作っておく 8lgb_train=lgb.Dataset(train_x,train_y) 9lgb_eval=lgb.Dataset(valid_x,valid_y) 10#パラメータを定義 11lgbm_params={'objective':'binary'} 12#lgb.trainで学習 13evals_result={} 14gbm=lgb.train(params=lgbm_params, 15 train_set=lgb_train, 16 valid_sets=[lgb_train,lgb_eval], 17 early_stopping_rounds=20, 18 evals_result=evals_result, 19 verbose_eval=10); 20 21### 試したこと 22 23スペルミスなどがないかよく見直した 24循環参照の解決策(どこに原因があるか見つける方法)について30分ほど調べた。しかしExcelの解決策しか見つけられなかった 25 26### 補足情報(FW/ツールのバージョンなど) 27 28ここに至るまで特に深刻なエラーもなく順調に進めていました 29Kaggleサイトの中からそのままnotebookを開いています 30
回答1件
あなたの回答
tips
プレビュー