あるユーザの生存分析を行っています。
pythonでXGBoostで2値分類を行う場合、xgboostアルゴリズムのclassifierを通常は使うと思いますが、regressorで連続値として予測し、正規化した後、0.5を閾値に01に変換してやった方が精度が良くなります。
なぜでしょうか?
2つの案件で、試しましたが、どちらの案件でも回帰の方が精度が良くなっています。
何か、もっともらしい理由を付けるとしたら、どのような理由になるでしょうか?
*パラメータチューニングは、分類アルゴリズムの場合も、回帰アルゴリズムの場合も同様に行っています。
あなたの回答
tips
プレビュー