回答編集履歴
1
追記
answer
CHANGED
@@ -1,8 +1,10 @@
|
|
1
1
|
一概にそうも言えない気がします。高次元・スパースの程度によるかもしれません。
|
2
2
|
(たとえば1000次元で1割埋まってるくらいならランダムフォレスト最強かもしれません。タスクによってはそういうことがあります)
|
3
3
|
|
4
|
-
それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレストを使うのは、あまり良くないかもしれません。
|
4
|
+
それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレスト(と、それ以外の決定木系モデル)を使うのは、あまり良くないかもしれません。
|
5
5
|
|
6
|
+
---
|
7
|
+
|
6
8
|
> 具体的に言えば、例えば100000行のデータがあって、ある特徴量のうち、100行のみが値を持ちそれ以外は0とします。このような場合でも、仮にこの100行の目的変数が十分にその他と異なれば、問題なく分岐されますよね。
|
7
9
|
|
8
10
|
これには何通りかの答え方が考えられます。
|