scikit-learnのサンプルコードの一部分を解説して欲しいです

どちらかというと数学の質問になりそうなのですが
数学が苦手でして…解説をお願いしたいです。

https://scikit-learn.org/stable/auto_examples/compose/plot_transformed_target.html

上記リンクは「scikit-learnを使って、データを対数変換してから回帰分析した際の効果」を説明したページだと理解しています。
こちらのコードが2例ありまして上の方、Synthetic exampleの例にあるコードについての質問です。

python
1X, y = make_regression(n_samples=10000, noise=100, random_state=0)
2y = np.expm1((y + abs(y.min())) / 200)
3y_trans = np.log1p(y)

とあるのですが
これの真ん中の行はなぜ200で割っているのでしょうか？
200で割らないと指数分布にならないなというのは確かめたのですが…

よろしくお願いいたします。

行動規範の内容に同意します

回答1件

指数関数の中身ですから、うっかり大きい値を入れてしまうと出力も相当大きい値になってしまい、それで回帰ができないということもないのでしょうけれども、たとえばグラフの目盛りが上限2000では済まなくなったりして不都合、なので適当に調整している……

というだけの話と思われます。

投稿2021/02/09 18:23

hayataka2049

総合スコア30935

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

scikit-learnのサンプルコードの一部分を解説して欲しいです

関連した質問