質問編集履歴
1
説明文の改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,89 +1,33 @@
|
|
1
|
-
現在、
|
1
|
+
現在、WEB検索のプログラムを独学中です。
|
2
|
+
|
3
|
+
最終的にはfacebook内を検索できるPGが作れるようになりたいです。
|
2
4
|
|
3
5
|
|
4
6
|
|
5
|
-
|
7
|
+
PGはservletとjspを使って作成する予定です。
|
8
|
+
|
9
|
+
使用言語はJAVAです。
|
6
10
|
|
7
11
|
|
8
12
|
|
9
|
-
それで、恐縮ですが、検索プログラムの勉強でこれがよかった
|
10
|
-
|
11
|
-
、自分はこうした等、ご経験を教えていただけないでしょうか。
|
13
|
+
1.それで恐れ入りますが、初心者が検索プログラムの勉強を始めるにあたり、この本がよかった、または自分はこうして学習した等、ご経験を教えていただけないでしょうか。
|
12
14
|
|
13
15
|
|
14
16
|
|
17
|
+
補足:自分の状態は、検索プログラム自体、初めて組むので、
|
18
|
+
|
15
|
-
|
19
|
+
まず手始めにブログをソースで取得する部分を作ってみたところです。
|
16
20
|
|
17
21
|
|
18
22
|
|
19
|
-
自分の状態は:
|
20
|
-
|
21
|
-
|
23
|
+
2.また、WEB検索プログラムを調べたところ、WEBでの大量データの全文検索にはlunceneがよいと意見をよく見かけました。
|
22
24
|
|
23
25
|
|
24
26
|
|
25
|
-
|
27
|
+
ただ、自分はまだ「基礎からのサーブレット/JSP」宮本信二著 SoftBanlCreativeが一冊終わったところです。
|
26
28
|
|
27
|
-
|
28
|
-
|
29
|
-
|
29
|
+
レベル的にlunceneの勉強をするには早いと思われるのでその間のレベルを探しています。
|
30
|
-
|
31
|
-
|
32
30
|
|
33
31
|
|
34
32
|
|
35
33
|
お忙しい中、申し訳ありませんが、どうぞよろしくお願いします。
|
36
|
-
|
37
|
-
※ソースコードは自分のレベルの説明がまだうまくできないため、説明するための補足です。
|
38
|
-
|
39
|
-
```ここに言語を入力
|
40
|
-
|
41
|
-
servlet:doGet
|
42
|
-
|
43
|
-
long num = 開始番号L;
|
44
|
-
|
45
|
-
for(num = 開始番号L;num <= 最終番号L;num ++){
|
46
|
-
|
47
|
-
String st = "http://AAAA/BBBB/CCC-"+String.valueOf(num) +".html";
|
48
|
-
|
49
|
-
URL url = new URL(st);
|
50
|
-
|
51
|
-
String sb = Test_WEB.getSourceText(url);
|
52
|
-
|
53
|
-
System.out.println(sb);←検索ロジックはまだで、取得したファイルの中身を確認するため、System.out.printlnで出しています。
|
54
|
-
|
55
|
-
また、相手先のファイルが連番になる保証はないため、この部分でまだ悩んでいるレベルです。
|
56
|
-
|
57
|
-
}
|
58
|
-
|
59
|
-
Class:
|
60
|
-
|
61
|
-
public static String getSourceText(URL url) throws IOException {
|
62
|
-
|
63
|
-
InputStream in = url.openStream();
|
64
|
-
|
65
|
-
StringBuilder sb = new StringBuilder();
|
66
|
-
|
67
|
-
try {
|
68
|
-
|
69
|
-
BufferedReader bf = new BufferedReader(new InputStreamReader(in));
|
70
|
-
|
71
|
-
String s;
|
72
|
-
|
73
|
-
while ((s=bf.readLine())!=null) {
|
74
|
-
|
75
|
-
sb.append(s);
|
76
|
-
|
77
|
-
}
|
78
|
-
|
79
|
-
} finally {
|
80
|
-
|
81
|
-
in.close();
|
82
|
-
|
83
|
-
}
|
84
|
-
|
85
|
-
return sb.toString();
|
86
|
-
|
87
|
-
}
|
88
|
-
|
89
|
-
```
|