回答編集履歴
2
修正
answer
CHANGED
@@ -41,6 +41,6 @@
|
|
41
41
|
```
|
42
42
|
|
43
43
|
#### 説明
|
44
|
-
文字レベル1,2,3-gramで特徴量を作り、
|
44
|
+
文字レベル1,2,3-gramで特徴量を作り、k平均法でクラスタリングしただけです。
|
45
45
|
|
46
46
|
これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。
|
1
追記
answer
CHANGED
@@ -38,4 +38,9 @@
|
|
38
38
|
confusion, refusion
|
39
39
|
"""
|
40
40
|
|
41
|
-
```
|
41
|
+
```
|
42
|
+
|
43
|
+
#### 説明
|
44
|
+
文字レベル1,2,3-gramで特徴量を作り、KMeansでクラスタリングしただけです。
|
45
|
+
|
46
|
+
これだと同じグループになる基準どうこうという議論はほぼできないのですが、それでも困らないのであれば簡単で有効な方法です。特徴量の作り方をいじって傾向を変えることもできます(2-gram以上だけ使う、tf-idfを使うなどが良いかも)。
|