回答率: 85.36%

質問するログイン新規登録

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

詳細はこちら

トップ Python 3.xに関する質問

Q&A

解決済

1回答

871閲覧

Python MinMaxScaler関数を使っても0-1の値にならない

総合スコア71

0グッド

0クリップ

投稿2019/10/06 06:59

編集2019/10/06 08:48

0

0

前提・実現したいこと

scikit-learnのMinMaxScaleを使ってデータを0-1の値に正規化したいです。
trainデータの方はうまく0-1に正規化されたのですが、testデータの方がうまくいきません。
trainとtestデータの違いは枚数だけ(train１万枚ほど、testは１枚)なのですが、枚数が影響しているのでしょうか。
scikit-learnの公式チュートリアルを読んでも原因がわからなかったため、こちらに質問をさせていただきました。
解決方法についてご存じの方がいらっしゃいましたら、教えていただけるととても助かります。
お手数をお掛けしますがどうぞよろしくお願いいたします。

該当のソースコード

Python
1from sklearn import preprocessing
2
3ms = MinMaxScaler()
4train = ms.fit_transform(train_a)
5test_normalA = ms.transform(test_normalA)
6print('train after ms', train)# [[0.78123564 0.79689527 0.6182032  ... 0.2401262  0.70691895 0.50597763]]
7print('test_normalA after ms', test_normalA)#  [[-1.3569405 -0.5547431 -0.9329261 ...  2.4957113  1.2391784  2.8852444]]
8

2019/10/06 07:57

ならない、とは実際にはどうなるんでしょうか

2019/10/06 07:59

>y_waiwai様 print関数の部分にコメントアウトでtrain, testデータそれぞれの値を記載しております。 trainデータの値は0-1におさまっていますが、testデータはそうなっていません（私の勘違いでしたらご指摘ください）。

2019/10/06 08:34

やりたいことは「標準化」ですか？「正規化」ですか？（文章内の表現は混ざっているようです）

2019/10/06 08:48

>meg_様混乱させてしまい申し訳ありません。やりたいことは正規化です。文章を修正いたしました。

行動規範の内容に同意します

回答1件

0

ベストアンサー

「train = ms.fit_transform(train_a)」でtrain_aにフィットさせているので、「test_normalA」で0-1の範囲に収まらない場合もあるかと思いますが、それで問題ないでしょう。

ナード戦隊データマン

スケール変換自体の数学は非常に簡単ですが、訓練データとテストデータは必ず同一の基準で変換しなければなりません。fitメソッドで訓練データの変換基準を構築した後、テストデータでfitを使ってはなりません。必ず、transformメソッドを適用しましょう。

投稿2019/10/06 09:16

総合スコア10736

2019/10/06 09:39

>meg_様ご回答ありがとうございました！テストデータは0-1の範囲に収まらなくても問題ないのですね。。安心しました。いつもありがとうございます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Python 3.xに関する質問

Python MinMaxScaler関数を使っても0-1の値にならない