pythonでクラスター分析(k−means法)を行いたいのですが、クラスター数を何かの指標を設けて自動で設定したいです。何かいい方法はないでしょうか?
クラスター分析を行いたいデータが多いので、ウォード法でデンドログラムを表示させてから自分で決めるのは骨が折れる作業になってしまいます。
また、同じ分析を対象を変えて複数回実行するので、その度にデンドログラムから「自分が」最適と思うクラスター数にすると、クラスタリングの方法がぶれぶれになってしまいます。
以上の理由から、何かの指標を設けて、その指標がある一定の値を超えた瞬間のクラスター数を採用する。という方法で行いたいと考えました。
過去に、
全個体の平方和に占めるクラスター間の平方和の割合が〇〇以上になった時点のクラスター数
で分析したいという旨の質問をさせていただいたのですが、回答がつくことはありませんでした。
なので、上の基準で分析できればベストですが、その他の方法でも構いませんので、どなたかご存知ないでしょうか?
よろしくお願いします。

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。