質問編集履歴
2
画像追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -133,3 +133,9 @@
|
|
133
133
|
0. なぜ正確にHTMLを正確に読み込めないのか?
|
134
134
|
|
135
135
|
0. どのようにすれば読み込めるようになるのか?
|
136
|
+
|
137
|
+
|
138
|
+
|
139
|
+
以下のようになってしまいます。
|
140
|
+
|
141
|
+
![イメージ説明](fe2fb24db9f2417154fcc08bfe5ed538.jpeg)
|
1
説明の追加と文章追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,18 +1,66 @@
|
|
1
|
+
### 実現したいこと
|
2
|
+
|
1
|
-
JAVAを使いURLからhtmlを読み込みたいです。
|
3
|
+
**JAVAを使いURLからhtmlを読み込みたいです。**
|
4
|
+
|
5
|
+
説明
|
6
|
+
|
7
|
+
---
|
2
8
|
|
3
9
|
以下のソースコードを実行したところ、簡単なサイトのhtmlは読み込めるのですが、ヤフーなどの複雑なサイトのhtmlを正確に読み取ることができません。
|
4
10
|
|
5
|
-
|
11
|
+
正確に読み取れないとは以下のソースコードならば最後の行の「<meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">」
|
6
12
|
|
7
|
-
|
13
|
+
この部分が読み込めてなかったりします。
|
8
14
|
|
9
15
|
|
10
16
|
|
17
|
+
```ここに言語を入力
|
18
|
+
|
19
|
+
<html lang="ja">
|
20
|
+
|
11
|
-
|
21
|
+
<head>
|
22
|
+
|
23
|
+
<meta http-equiv="content-type" content="text/html; charset=utf-8">
|
24
|
+
|
25
|
+
<meta http-equiv="content-style-type" content="text/css">
|
26
|
+
|
27
|
+
<meta http-equiv="content-script-type" content="text/javascript">
|
28
|
+
|
29
|
+
<meta name="description" content="日本最大級のポータルサイト。検索、オークション、ニュース、天気、スポーツ、メール、ショッピングなど多数のサービスを展開。あなたの生活をより豊かにする「課題解決エンジン」を目指していきます。">
|
30
|
+
|
31
|
+
<meta name="robots" content="noodp">
|
32
|
+
|
33
|
+
<meta name="google-site-verification" content="fsLMOiigp5fIpCDMEVodQnQC7jIY1K3UXW5QkQcBmVs">
|
34
|
+
|
35
|
+
<link rel="alternate" href="android-app://jp.co.yahoo.android.yjtop/yahoojapan/home/top">
|
36
|
+
|
37
|
+
<link rel="alternate" media="only screen and (max-width: 640px)" href="https://m.yahoo.co.jp/">
|
38
|
+
|
39
|
+
<link rel="canonical" href="https://www.yahoo.co.jp/" />
|
40
|
+
|
41
|
+
<meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">
|
42
|
+
|
43
|
+
```
|
12
44
|
|
13
45
|
|
14
46
|
|
47
|
+
以下はURLからソースコードを習得するプログラムです
|
48
|
+
|
49
|
+
```ここに言語を入力
|
50
|
+
|
51
|
+
import java.io.InputStream;
|
52
|
+
|
53
|
+
import java.io.InputStreamReader;
|
54
|
+
|
55
|
+
import java.net.URL;
|
56
|
+
|
57
|
+
|
58
|
+
|
59
|
+
public class Hero {
|
60
|
+
|
61
|
+
|
62
|
+
|
15
|
-
public static void main(final String[] args){
|
63
|
+
public static void main(final String[] args){
|
16
64
|
|
17
65
|
URL url = null;
|
18
66
|
|
@@ -22,7 +70,7 @@
|
|
22
70
|
|
23
71
|
try {
|
24
72
|
|
25
|
-
url = new URL("https://www.yahoo.co.jp/");
|
73
|
+
url = new URL("[リンク内容](https://www.yahoo.co.jp/)");
|
26
74
|
|
27
75
|
|
28
76
|
|
@@ -75,3 +123,13 @@
|
|
75
123
|
|
76
124
|
|
77
125
|
}
|
126
|
+
|
127
|
+
```
|
128
|
+
|
129
|
+
質問
|
130
|
+
|
131
|
+
---
|
132
|
+
|
133
|
+
0. なぜ正確にHTMLを正確に読み込めないのか?
|
134
|
+
|
135
|
+
0. どのようにすれば読み込めるようになるのか?
|