グループ分け方法が思いつかず困っています

出力されたデータに対してアプローチ手法を思いつかず困っています。

100個のラベル付されたデータが存在します。
100個のデータについて似通ったものでいくつかのグループに振り分けたいと考えています。
そこで100個のデータ間の類似度(0以上の浮動小数点)を算出しました。
このデータを次にどう処理すればいいのかわからず困っています。

ここまでに使用したのはPython3のnumpyのみです。
解答の方をどうぞよろしくお願いいたします。

行動規範の内容に同意します

回答2件

ベストアンサー

どのレベルの回答が必要か分からないのですが…

くらいやってみれば、見えてくると思います。単語だけ挙げましたので、調べてみてください。
scikit-learn にいろいろ入っています。

投稿2017/01/27 02:49

総合スコア1111

おそらく、ですが、各データ間の類似度を評価されているので非階層的クラスタリング（k-meansや混合分布モデル）ではなく階層的クラスタリングをされたいのかと思います。

すなわち、

というステップかと思います。

ただ、残念ながらPythonでこれを実現する方法は詳しくないので
（私はRユーザーです）
「Python3」「階層的クラスタリング」
で検索されると良い情報にたどり着けるかと思います。

以上、参考まで。

投稿2017/01/30 19:19

総合スコア104

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問