回答編集履歴

1

追記

2019/01/21 04:04

投稿

hayataka2049
hayataka2049

スコア30933

test CHANGED
@@ -7,3 +7,9 @@
7
7
 
8
8
 
9
9
  カテゴリデータですらないもの(「tilte」とか怪しい)はさっさと捨てることになります。
10
+
11
+ (あるいは自然言語処理をかまして特徴量ベクトルに変換するか。「description」などそういうアプローチで処理すると良いのかもしれません。効くかどうかはタスク依存)
12
+
13
+
14
+
15
+ また、その場合は大量のゴミが混ざるので必要に応じて特徴選択してください。