質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

711閲覧

Googlecolabと手元の環境で機械学習の計算結果が変わってしまうのを一致させたい

last5

総合スコア1

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/10/12 16:50

前提

機械学習で分類問題を計算しています。
Googlecolabでいい結果が得られたので、手元環境で再現しようとしたところ、
計算結果が変わってしまいました。
Googlecolabのソースコードをコピペしただけです。

同じデータを回帰で計算(lgb.LGBMRegressor(n_jobs=-1, random_state=1))してみたら
計算結果が一致しましたので、スペルミス等はないと思います。

・手元環境
python 3.9
lightgbm 3.3.3
scikit-learn 1.1.2
・model = lgb.LGBMClassifier()、LogisticRegression()

・説明変数や目的変数の値は全く同じ。

その他必要な情報があればおっしゃってください。

よろしくお願いいたします。

実現したいこと

計算結果を一致させる方法はありますでしょうか。

試したこと

・パラメータはデフォルトで、Googlecolabで出力したパラメータを手元環境でもセットしてみましたが上手くいきませんでした。(下記はLGBMのパラメータ)
{'boosting_type': 'gbdt',
'class_weight': None,
'colsample_bytree': 1.0,
'importance_type': 'split',
'learning_rate': 0.1,
'max_depth': -1,
'min_child_samples': 20,
'min_child_weight': 0.001,
'min_split_gain': 0.0,
'n_estimators': 100,
'n_jobs': -1,
'num_leaves': 31,
'objective': None,
'random_state': None,
'reg_alpha': 0.0,
'reg_lambda': 0.0,
'silent': True,
'subsample': 1.0,
'subsample_for_bin': 200000,
'subsample_freq': 0}

・Googlecolabでpip install lightgbm をし、lightgbmのバージョンを合わせてみましたが上手くいきませんでした。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

melian

2022/10/12 17:31

'random_state': None という設定ですが、API ドキュメントには以下の様に記載されています。 lightgbm.LGBMClassifier — LightGBM 3.3.2.99 documentation https://lightgbm.readthedocs.io/en/latest/pythonapi/lightgbm.LGBMClassifier.html > random_state ... If None, default seeds in C++ code are used. random seed の値が Googlecolab とそちらの環境で異なっているのかもしれません。
last5

2022/10/12 23:33

ご確認ありがとうございます。 model = lgb.LGBMClassifier(random_state=1) として計算してみましたが、結果は変わりませんでした。
jbpb0

2022/10/13 02:40

それぞれの環境での結果は、実行する度に微妙に変わったりせず、ずっと同じなのでしょうか?
last5

2022/10/13 02:50

コメントありがとうございます。 結果はそれぞれ何回やってもずっと同じです。
jbpb0

2022/10/13 03:15

他人が現象を再現できるコードはありませんでしょうか? たとえば、どこかのWebページのコードをそのまま実行したら、google colabと(質問者さんの)ローカル環境で結果が変わる、的な
melian

2022/10/13 03:37

後は、lightgbm と scikit-learn と依存するパッケージのバージョンを完全に一致させる、でしょうかね。。。
last5

2022/10/13 03:54

y_predの結果も異なってました。
guest

回答1

0

ベストアンサー

Parameters
の「Core Parameters」の「deterministic」に、
「when you use the different seeds, different LightGBM versions, the binaries compiled by different compilers, or in different systems, the results are expected to be different」
と書いてあります

「the binaries compiled by different compilers」とか「in different systems」とかもとなると、結果違っても仕方ないですよね

投稿2022/10/13 05:13

jbpb0

総合スコア7653

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

last5

2022/10/13 16:06

ご回答ありがとうございます。 結果が変わるのは仕方ないのですね。 Googlecolabでfitしたmodelを保存して、手元環境で読み込むことでとりあえず解決しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問