回答編集履歴
2
修正
test
CHANGED
@@ -84,7 +84,7 @@
|
|
84
84
|
|
85
85
|
#### 説明
|
86
86
|
|
87
|
-
文字レベル1,2,3-gramで特徴量を作り、
|
87
|
+
文字レベル1,2,3-gramで特徴量を作り、k平均法でクラスタリングしただけです。
|
88
88
|
|
89
89
|
|
90
90
|
|
1
追記
test
CHANGED
@@ -79,3 +79,13 @@
|
|
79
79
|
|
80
80
|
|
81
81
|
```
|
82
|
+
|
83
|
+
|
84
|
+
|
85
|
+
#### 説明
|
86
|
+
|
87
|
+
文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
|
88
|
+
|
89
|
+
|
90
|
+
|
91
|
+
これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。
|