質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Kaggle

Kaggleは、機械学習モデルを構築するコンペティションのプラットフォームおよびその運営企業を指します。企業や政府といった組織とデータサイエンティスト・機械学習エンジニアを繋げるプラットフォームであり、単純なマッチングではなくコンペティションが特徴です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1663閲覧

Python:Kaggleで循環参照が検出される。コードのどの部分に問題があるのか判明させたい

Amaterasu11825

総合スコア1

Kaggle

Kaggleは、機械学習モデルを構築するコンペティションのプラットフォームおよびその運営企業を指します。企業や政府といった組織とデータサイエンティスト・機械学習エンジニアを繋げるプラットフォームであり、単純なマッチングではなくコンペティションが特徴です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/11/03 01:21

前提

機械学習初学者です。Kaggle・Pythonに関する質問です。
「KAGGLEのチュートリアル【第6版】」を参考にしながらタイタニック問題に取り組んでいます。

実現したいこと

・データを67%:33%の割合でtrainセットとvalidセット(検証用セット)に分割して学習させたい
・循環参照がなぜ、どの部分が問題で出ているのか判明させたい

発生している問題・エラーメッセージ

循環参照が検出されましたと出る(エラーメッセージ最下部)

エラーメッセージ
ValueError Traceback (most recent call last)
/tmp/ipykernel_27/1054045390.py in <module>
13 early_stopping_rounds=20,
14 evals_result=evals_result,
---> 15 verbose_eval=10);
16 #valid_xについて推論
17 oof=(gbm.predict(valid_x)>0.5).astype(int)

/opt/conda/lib/python3.7/site-packages/lightgbm/engine.py in train(params, train_set, num_boost_round, valid_sets, valid_names, fobj, feval, init_model, feature_name, categorical_feature, early_stopping_rounds, evals_result, verbose_eval, learning_rates, keep_training_booster, callbacks)
314 booster.best_score[dataset_name][eval_name] = score
315 if not keep_training_booster:
--> 316 booster.model_from_string(booster.model_to_string(), verbose='_silent_false').free_dataset()
317 return booster
318

/opt/conda/lib/python3.7/site-packages/lightgbm/basic.py in model_to_string(self, num_iteration, start_iteration, importance_type)
3417 ptr_string_buffer))
3418 ret = string_buffer.value.decode('utf-8')
-> 3419 ret += _dump_pandas_categorical(self.pandas_categorical)
3420 return ret
3421

/opt/conda/lib/python3.7/site-packages/lightgbm/basic.py in _dump_pandas_categorical(pandas_categorical, file_name)
617
618 def _dump_pandas_categorical(pandas_categorical, file_name=None):
--> 619 categorical_json = json.dumps(pandas_categorical, default=json_default_with_numpy)
620 pandas_str = f'\npandas_categorical:{categorical_json}\n'
621 if file_name is not None:

/opt/conda/lib/python3.7/json/init.py in dumps(obj, skipkeys, ensure_ascii, check_circular, allow_nan, cls, indent, separators, default, sort_keys, **kw)
236 check_circular=check_circular, allow_nan=allow_nan, indent=indent,
237 separators=separators, default=default, sort_keys=sort_keys,
--> 238 **kw).encode(obj)
239
240

/opt/conda/lib/python3.7/json/encoder.py in encode(self, o)
197 # exceptions aren't as detailed. The list call should be roughly
198 # equivalent to the PySequence_Fast that ''.join() would do.
--> 199 chunks = self.iterencode(o, _one_shot=True)
200 if not isinstance(chunks, (list, tuple)):
201 chunks = list(chunks)

/opt/conda/lib/python3.7/json/encoder.py in iterencode(self, o, _one_shot)
255 self.key_separator, self.item_separator, self.sort_keys,
256 self.skipkeys, _one_shot)
--> 257 return _iterencode(o, 0)
258
259 def _make_iterencode(markers, _default, _encoder, _indent, _floatstr,

ValueError: Circular reference detected

該当のソースコード

Python

1ソースコード 2```import lightgbm as lgb 3from sklearn.model_selection import train_test_split 4from sklearn.metrics import accuracy_score 5#X_trainとy_trainをtrainとvalidに分割 6train_x,valid_x,train_y,valid_y=train_test_split(X_train,y_train,test_size=0.33,random_state=0) 7#lgb.Datasetでtrainとvalidを作っておく 8lgb_train=lgb.Dataset(train_x,train_y) 9lgb_eval=lgb.Dataset(valid_x,valid_y) 10#パラメータを定義 11lgbm_params={'objective':'binary'} 12#lgb.trainで学習 13evals_result={} 14gbm=lgb.train(params=lgbm_params, 15 train_set=lgb_train, 16 valid_sets=[lgb_train,lgb_eval], 17 early_stopping_rounds=20, 18 evals_result=evals_result, 19 verbose_eval=10); 20 21### 試したこと 22 23スペルミスなどがないかよく見直した 24循環参照の解決策(どこに原因があるか見つける方法)について30分ほど調べた。しかしExcelの解決策しか見つけられなかった 25 26### 補足情報(FW/ツールのバージョンなど) 27 28ここに至るまで特に深刻なエラーもなく順調に進めていました 29Kaggleサイトの中からそのままnotebookを開いています 30

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ara_ara

2022/11/08 23:52

全スクリプト載せていただけますか? kaggle上のtitanicのnotebookでコピペしたら即再現できるはずなので
Amaterasu11825

2022/11/09 09:35

こんばんは。コメントありがとうございます。 先ほどもう一度コードを確認していたところ、解決いたしました。 せっかくコメントしてくださったのにすみません。
ara_ara

2022/11/09 10:15

いえいえ 解決できたようで何よりです お疲れ様でした
guest

回答1

0

自己解決

本のページを一部読み飛ばしてしまっていて、そこが結構大事な部分だったようです。
素人くさいミスで質問してしまいすみません

投稿2022/11/09 09:36

Amaterasu11825

総合スコア1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問