教師あり機械学習(回帰問題)で予測モデリングを構築しています。このとき、予測精度の悪いデータセットと予測精度のよいデータセットの違いを比較して精度悪化の原因を追求し、精度向上を図りたいと思っています。
この時、精度のよいデータセットと悪いデータセットの特徴を比較をする方法はありますでしょうか?
変数が数個であれば、予測精度でグループ分けして、各々ヒストグラムを描くことが可能ですが、カラム数が数百〜1000以上あり、全カラムを比較することは容易ではありません。
こういうワードで調べるといいよ、というキーワードでも大変助かります。
回答1件
あなたの回答
tips
プレビュー