🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Q&A

1回答

573閲覧

scikit-learnのサンプルコードの一部分を解説して欲しいです

hiycode1

総合スコア0

scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

0グッド

0クリップ

投稿2021/02/09 03:58

編集2021/02/09 04:58

どちらかというと数学の質問になりそうなのですが
数学が苦手でして…解説をお願いしたいです。

https://scikit-learn.org/stable/auto_examples/compose/plot_transformed_target.html

上記リンクは「scikit-learnを使って、データを対数変換してから回帰分析した際の効果」を説明したページだと理解しています。
こちらのコードが2例ありまして上の方、Synthetic exampleの例にあるコードについての質問です。

python

1X, y = make_regression(n_samples=10000, noise=100, random_state=0) 2y = np.expm1((y + abs(y.min())) / 200) 3y_trans = np.log1p(y)

とあるのですが
これの真ん中の行はなぜ200で割っているのでしょうか?
200で割らないと指数分布にならないなというのは確かめたのですが…

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

指数関数の中身ですから、うっかり大きい値を入れてしまうと出力も相当大きい値になってしまい、それで回帰ができないということもないのでしょうけれども、たとえばグラフの目盛りが上限2000では済まなくなったりして不都合、なので適当に調整している……

というだけの話と思われます。

投稿2021/02/09 18:23

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問