🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

871閲覧

Python MinMaxScaler関数を使っても0-1の値にならない

SuzuAya

総合スコア71

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/10/06 06:59

編集2019/10/06 08:48

前提・実現したいこと

scikit-learnのMinMaxScaleを使ってデータを0-1の値に正規化したいです。
trainデータの方はうまく0-1に正規化されたのですが、testデータの方がうまくいきません。
trainとtestデータの違いは枚数だけ(train1万枚ほど、testは1枚)なのですが、枚数が影響しているのでしょうか。
scikit-learnの公式チュートリアルを読んでも原因がわからなかったため、こちらに質問をさせていただきました。
解決方法についてご存じの方がいらっしゃいましたら、教えていただけるととても助かります。
お手数をお掛けしますがどうぞよろしくお願いいたします。

該当のソースコード

Python

1from sklearn import preprocessing 2 3ms = MinMaxScaler() 4train = ms.fit_transform(train_a) 5test_normalA = ms.transform(test_normalA) 6print('train after ms', train)# [[0.78123564 0.79689527 0.6182032 ... 0.2401262 0.70691895 0.50597763]] 7print('test_normalA after ms', test_normalA)# [[-1.3569405 -0.5547431 -0.9329261 ... 2.4957113 1.2391784 2.8852444]] 8

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2019/10/06 07:57

ならない、とは実際にはどうなるんでしょうか
SuzuAya

2019/10/06 07:59

>y_waiwai様 print関数の部分にコメントアウトでtrain, testデータそれぞれの値を記載しております。 trainデータの値は0-1におさまっていますが、testデータはそうなっていません(私の勘違いでしたらご指摘ください)。
meg_

2019/10/06 08:34

やりたいことは「標準化」ですか?「正規化」ですか?(文章内の表現は混ざっているようです)
SuzuAya

2019/10/06 08:48

>meg_様 混乱させてしまい申し訳ありません。やりたいことは正規化です。文章を修正いたしました。
guest

回答1

0

ベストアンサー

「train = ms.fit_transform(train_a)」でtrain_aにフィットさせているので、「test_normalA」で0-1の範囲に収まらない場合もあるかと思いますが、それで問題ないでしょう。

ナード戦隊データマン

スケール変換自体の数学は非常に簡単ですが、訓練データとテストデータは必ず同一の基準で変換しなければなりません。fitメソッドで訓練データの変換基準を構築した後、テストデータでfitを使ってはなりません。必ず、transformメソッドを適用しましょう。

投稿2019/10/06 09:16

meg_

総合スコア10736

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

SuzuAya

2019/10/06 09:39

>meg_様 ご回答ありがとうございました!テストデータは0-1の範囲に収まらなくても問題ないのですね。。安心しました。いつもありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問