質問するログイン新規登録

回答編集履歴

1

追記

2019/10/02 11:27

投稿

hayataka2049
hayataka2049

スコア30939

answer CHANGED
@@ -1,8 +1,10 @@
1
1
  一概にそうも言えない気がします。高次元・スパースの程度によるかもしれません。
2
2
  (たとえば1000次元で1割埋まってるくらいならランダムフォレスト最強かもしれません。タスクによってはそういうことがあります)
3
3
 
4
- それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレストを使うのは、あまり良くないかもしれません。
4
+ それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレスト(と、それ以外の決定木系モデル)を使うのは、あまり良くないかもしれません。
5
5
 
6
+ ---
7
+
6
8
  > 具体的に言えば、例えば100000行のデータがあって、ある特徴量のうち、100行のみが値を持ちそれ以外は0とします。このような場合でも、仮にこの100行の目的変数が十分にその他と異なれば、問題なく分岐されますよね。
7
9
 
8
10
  これには何通りかの答え方が考えられます。