###前提・実現したいこと
現在,クラスタリングについて独学で学んでいます.
まだ座学だけで知識を得ているだけの状態ですので,
具体的に何に使うかはまだ決まっていませんが,
興味があり現在学んでいる段階です.
よく見かける記事で以下のことが書かれています.
クラスター分析を始めるときに決めなくてはならないことは、一般的には以下の4つで、それぞれ、どれを選択するかがポイントになる。
1.グループ分けの対象
サンプルを分類するのか、変数を分類するのか
2.分類の形式(種類、生成)
階層的方法か非階層的方法か
3.分類に用いる対象間の距離(類似度)
ユークリッド距離、マハラノビス距離、コサイン類似度(距離)…
4.クラスターの合併方法(クラスター間の距離の測定方法)
ウォード法、群平均法、最短距離法、最長距離法…
この1のグループ分けの対象についてお聞きしたいことがあります.
サンプルと変数の違いは何なんでしょうか?
分類目的でどちらを対象とするのか決まると書いてあったのですが,
具体的にサンプルと変数はどのような時に対象となるのか.
サンプルとはどのようなもので,変数とはどのようなものなのか知りたいと思います.
###試したこと
こちらの記事を参考にさせていただきました.
http://business.nikkeibp.co.jp/atclbdt/15/258678/071500002/?ST=print
###補足情報(言語/FW/ツール等のバージョンなど)
より詳細な情報
回答4件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。