teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

3

修正

2020/05/07 12:12

投稿

tiitoi
tiitoi

スコア21960

answer CHANGED
@@ -3,4 +3,11 @@
3
3
  まず、標準化が有効かどうかは、アルゴリズムによります。
4
4
  今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
5
5
 
6
- SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。
6
+ SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。
7
+
8
+ > ダミー変数は正規化に近く、「最低が0、最高が1になるようにデータを
9
+ 加工(スケーリング)」したものと考えることができ
10
+
11
+ ダミー変数化の目的は、スケーリングではなく、カテゴリ変数を数値で表すことが目的です。
12
+ 例えば、晴れ、曇、雨という3つの値をとるカテゴリ変数があったとき、これを晴れ=0、曇=1、雨=2と数値で表すと、これら3つには本来ないはずの大小関係ができてしまいます。
13
+ そのため、それぞれ3つのダミー変数に分けて、それぞれの変数を0, 1 で表すことでそうならないようにします。

2

修正

2020/05/07 12:12

投稿

tiitoi
tiitoi

スコア21960

answer CHANGED
@@ -3,4 +3,4 @@
3
3
  まず、標準化が有効かどうかは、アルゴリズムによります。
4
4
  今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
5
5
 
6
- SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も特徴量全体で標準化します。
6
+ SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。

1

修正

2020/05/07 12:09

投稿

tiitoi
tiitoi

スコア21960

answer CHANGED
@@ -1,6 +1,6 @@
1
1
  > そこで、ダミー変数に特徴量の標準化を使うべきかという点でご意見をいただきたいです。
2
2
 
3
- 標準化が有効かどうかは、アルゴリズムによります。
3
+ まず、標準化が有効かどうかは、アルゴリズムによります。
4
4
  今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
5
5
 
6
6
  SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も特徴量全体で標準化します。