回答率: 85.29%

質問するログイン新規登録

トップアルゴリズムに関する質問 Synthetic datasetsについて

編集履歴

回答編集履歴

3

d

2019/09/18 07:12

投稿

スコア21962

answer CHANGED Viewed

@@ -24,5 +24,5 @@
 > ・Fig.12ではFig.11のSynthetic datasetsをどう利用して横軸の値を変化させたのでしょうか。
-Synthetic datasets の点の数を増やしたときの実行時間を見ているのだと思います。
+Synthetic datasets の点の数を変化させたときのアルゴリズムの実行時間を見ているのだと思います。
 データセットはプログラムで生成しているので、点の数を変えたりもできそうですね。

2

d

2019/09/18 07:11

投稿

スコア21962

answer CHANGED Viewed

@@ -8,4 +8,21 @@
 クラスタが沢山あって、点が半球状に偏っているので、k平均法でクラスタリングするのが難しそうだなという印象を受けます。
 具体的にどのように生成したかはソースコードが公開されていない以上わかりません。
-どうしても必要なのであれば、論文作者のメールアドレスが書いてあるので、メールで問い合わせてください。
+どうしても必要なのであれば、論文作者のメールアドレスが書いてあるので、メールで問い合わせてください。
+## 追記
+> ・Fig.11で見えている格子状の点はそれぞれがクラスタという認識でよろしいのでしょうか。
+格子状の赤○が1つのクラスタなのではないかと思います。(面倒なので、途中までしか○つけていません。)
+![イメージ説明](7261e69d4f97f21d316e3edac1e0908a.png)
+> Fig.11の縦軸と横軸の数字は何を表しているのでしょうか。
+2次元上の点の座標値です。
+> ・Fig.12ではFig.11のSynthetic datasetsをどう利用して横軸の値を変化させたのでしょうか。
+Synthetic datasets の点の数を増やしたときの実行時間を見ているのだと思います。
+データセットはプログラムで生成しているので、点の数を変えたりもできそうですね。

1

d

2019/09/18 07:11

投稿

スコア21962

answer CHANGED Viewed

@@ -4,7 +4,7 @@
 論文の趣旨が「k-mean を改良したアルゴリズムの提案」なので、そのアルゴリズムの性能を人工的に (Synthetic) 作ったデータで評価しましたという話でこのデータセットに特に深い意味はないと思います。
 このようなデータセットを作った意図としては、適切にクラスタリングするのがそれなりに難しいデータを用意して、論文で提案している手法で既存よりうまくクラスタリングできることをアピールするためです。
-データの特徴を見てみると、2次元空間上に格子状にクラスタを作成して、各クラスタは半球状に分布する点で構成されています。
+データの特徴を見てみると、2次元空間上に格子状にクラスタが配置されており、各クラスタは半球状に分布する点で構成されています。
 クラスタが沢山あって、点が半球状に偏っているので、k平均法でクラスタリングするのが難しそうだなという印象を受けます。
 具体的にどのように生成したかはソースコードが公開されていない以上わかりません。