回答編集履歴

追記

2019/10/02 11:27

投稿

スコア30939

answer CHANGED Viewed

@@ -1,8 +1,10 @@
 一概にそうも言えない気がします。高次元・スパースの程度によるかもしれません。
 （たとえば1000次元で1割埋まってるくらいならランダムフォレスト最強かもしれません。タスクによってはそういうことがあります）
-それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレストを使うのは、あまり良くないかもしれません。
+それはそれとして、10^4を超えるような高次元スパースデータでランダムフォレスト（と、それ以外の決定木系モデル）を使うのは、あまり良くないかもしれません。
+---
 > 具体的に言えば、例えば100000行のデータがあって、ある特徴量のうち、100行のみが値を持ちそれ以外は０とします。このような場合でも、仮にこの100行の目的変数が十分にその他と異なれば、問題なく分岐されますよね。
 これには何通りかの答え方が考えられます。