pythonのクラスター分析で、郡内分散や群間分散を出力する方法はありますでしょうか?
あるとしたら以下のコードをどのように変更したらよいでしょうか?
どの程度のグループに分けるかを決める際に、指示されたクラスター数の求め方が、
全個体の平方和に占めるクラスター間の平方和の割合が〇〇以上になった時点のクラスター数
ですので、これは群間分散のことを指していると考え質問させていただきました。
理想は上の条件を組み込んだ上でのクラスター分析ができるようになることなのですが可能でしょうか?
よろしくお願い致します。
以下コードです。
mats_deleteはクラスター分析をしたい行列です。
# -*- coding: utf-8 -*- import mysql.connector import pandas as pd import numpy as np from sklearn.cluster import KMeans from scipy.spatial.distance import pdist from scipy.cluster.hierarchy import linkage, dendrogram from matplotlib.pyplot import show import matplotlib.pyplot if __name__ == "__main__": (コード省略) pdist = pdist(mats_delete) result = linkage(pdist) dendrogram(result, p=20, truncate_mode='lastp') matplotlib.pyplot.plot(dendrogram) show() コード
あなたの回答
tips
プレビュー