回答編集履歴
2
コメント追加
test
CHANGED
@@ -23,3 +23,21 @@
|
|
23
23
|
目標に応じてアプローチが異なると思います。
|
24
24
|
|
25
25
|
機械学習を理解するのであれば、上手く行くケースでまずは感覚を掴まれたらいかがかと思います。
|
26
|
+
|
27
|
+
|
28
|
+
|
29
|
+
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
### (追記)
|
34
|
+
|
35
|
+
>最終目標はURLから悪性か良性かの分類プログラムを作りたいです。
|
36
|
+
|
37
|
+
具体的なイメージはないのですが、悪性の教師データを取得するのは難しいような気がします。
|
38
|
+
|
39
|
+
よくある異常検知のように正常データを大量に学習して、異物を発見するようなモデルになるように思いますが、果たしてURLの文字列から異物を判断することができるか疑問です。
|
40
|
+
|
41
|
+
ウィルス検知やマルウェア検知のアルゴリズムなどを調べてみてはいかがでしょうか?
|
42
|
+
|
43
|
+
初期のスパム検知にはナイーブベイズが利用されていたと聞いたことがあります。
|
1
誤記の修正
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
直接的な回答では無いのですが大阪大学(
|
1
|
+
直接的な回答では無いのですが大阪大学(熊本大学)の松原先生のKDDの発表でURLのアクセスを予測する発表があります。URLとアクセスしたID、時間をテンソルに変換して、時系列に予測するモデルです。
|
2
2
|
|
3
3
|
URLを何らかの方法でテンソルに変換していると思います。
|
4
4
|
|