回答編集履歴

2

修正

2019/06/13 01:53

投稿

hayataka2049
hayataka2049

スコア30933

test CHANGED
@@ -84,7 +84,7 @@
84
84
 
85
85
  #### 説明
86
86
 
87
- 文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
87
+ 文字レベル1,2,3-gramで特徴量を作り、k平均法でクラスタリングしただけです。
88
88
 
89
89
 
90
90
 

1

追記

2019/06/13 01:52

投稿

hayataka2049
hayataka2049

スコア30933

test CHANGED
@@ -79,3 +79,13 @@
79
79
 
80
80
 
81
81
  ```
82
+
83
+
84
+
85
+ #### 説明
86
+
87
+ 文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
88
+
89
+
90
+
91
+ これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。