teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

修正

2019/06/13 01:53

投稿

hayataka2049
hayataka2049

スコア30939

answer CHANGED
@@ -41,6 +41,6 @@
41
41
  ```
42
42
 
43
43
  #### 説明
44
- 文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
44
+ 文字レベル1,2,3-gramで特徴量を作り、k平均法でクラスタリングしただけです。
45
45
 
46
46
  これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。

1

追記

2019/06/13 01:52

投稿

hayataka2049
hayataka2049

スコア30939

answer CHANGED
@@ -38,4 +38,9 @@
38
38
  confusion, refusion
39
39
  """
40
40
 
41
- ```
41
+ ```
42
+
43
+ #### 説明
44
+ 文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
45
+
46
+ これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。