回答編集履歴
3
修正
answer
CHANGED
@@ -3,4 +3,11 @@
|
|
3
3
|
まず、標準化が有効かどうかは、アルゴリズムによります。
|
4
4
|
今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
|
5
5
|
|
6
|
-
SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。
|
6
|
+
SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。
|
7
|
+
|
8
|
+
> ダミー変数は正規化に近く、「最低が0、最高が1になるようにデータを
|
9
|
+
加工(スケーリング)」したものと考えることができ
|
10
|
+
|
11
|
+
ダミー変数化の目的は、スケーリングではなく、カテゴリ変数を数値で表すことが目的です。
|
12
|
+
例えば、晴れ、曇、雨という3つの値をとるカテゴリ変数があったとき、これを晴れ=0、曇=1、雨=2と数値で表すと、これら3つには本来ないはずの大小関係ができてしまいます。
|
13
|
+
そのため、それぞれ3つのダミー変数に分けて、それぞれの変数を0, 1 で表すことでそうならないようにします。
|
2
修正
answer
CHANGED
@@ -3,4 +3,4 @@
|
|
3
3
|
まず、標準化が有効かどうかは、アルゴリズムによります。
|
4
4
|
今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
|
5
5
|
|
6
|
-
SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も
|
6
|
+
SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も一律に標準化します。
|
1
修正
answer
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
> そこで、ダミー変数に特徴量の標準化を使うべきかという点でご意見をいただきたいです。
|
2
2
|
|
3
|
-
標準化が有効かどうかは、アルゴリズムによります。
|
3
|
+
まず、標準化が有効かどうかは、アルゴリズムによります。
|
4
4
|
今回の LinearRegression の場合、アルゴリズムの仕組み上、標準化しても、しなくても結果は変わりません。
|
5
5
|
|
6
6
|
SGD のような標準化が効いてくるアルゴリズムの場合、ダミー変数もそうでない変数も特徴量全体で標準化します。
|