標記について質問させていただきます。
現在、ある構造化データをクラスタリングし、分類したいと考えています。
対象としている構造化データのカラム数は500程度あり、それなりの数になっています。
なので、一旦変数選択を行い、いらないカラムは削除してからクラスタリングを行いたいと思っています。
下記質問です。
■クラスタリングにおいては、どのような変数選択手法が適しているか。
→例えば重回帰分析の場合はVIFをつかって変数選択を行うだとか、相関行列を作成して相関係数が高いものは除外するとか、そのような変数選択手法があると理解しております。
クラスタリングの場合は、どのような変数選択手法がよいのでしょうか。
■可能であれば、上記でご教示いただいた変数選択手法のサンプルコード(Webや書籍)を教えていただければと思います。
どうぞよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。