質問編集履歴

2

画像追加

2018/10/03 12:44

投稿

moment_now_love
moment_now_love

スコア9

test CHANGED
File without changes
test CHANGED
@@ -133,3 +133,9 @@
133
133
  0. なぜ正確にHTMLを正確に読み込めないのか?
134
134
 
135
135
  0. どのようにすれば読み込めるようになるのか?
136
+
137
+
138
+
139
+ 以下のようになってしまいます。
140
+
141
+ ![イメージ説明](fe2fb24db9f2417154fcc08bfe5ed538.jpeg)

1

説明の追加と文章追加

2018/10/03 12:44

投稿

moment_now_love
moment_now_love

スコア9

test CHANGED
File without changes
test CHANGED
@@ -1,18 +1,66 @@
1
+ ### 実現したいこと
2
+
1
- JAVAを使いURLからhtmlを読み込みたいです。
3
+ **JAVAを使いURLからhtmlを読み込みたいです。**
4
+
5
+ 説明
6
+
7
+ ---
2
8
 
3
9
  以下のソースコードを実行したところ、簡単なサイトのhtmlは読み込めるのですが、ヤフーなどの複雑なサイトのhtmlを正確に読み取ることができません。
4
10
 
5
- 1.なぜ読み込めないのか?
11
+ 正確に読み取れないとは以下ソースコードならば最後の行の「<meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">」
6
12
 
7
- 2・どようにすれば読み込めるようにるの
13
+ 部分が読み込めなかったりします。
8
14
 
9
15
 
10
16
 
17
+ ```ここに言語を入力
18
+
19
+ <html lang="ja">
20
+
11
- ご回答よろしくお願いします。
21
+ <head>
22
+
23
+ <meta http-equiv="content-type" content="text/html; charset=utf-8">
24
+
25
+ <meta http-equiv="content-style-type" content="text/css">
26
+
27
+ <meta http-equiv="content-script-type" content="text/javascript">
28
+
29
+ <meta name="description" content="日本最大級のポータルサイト。検索、オークション、ニュース、天気、スポーツ、メール、ショッピングなど多数のサービスを展開。あなたの生活をより豊かにする「課題解決エンジン」を目指していきます。">
30
+
31
+ <meta name="robots" content="noodp">
32
+
33
+ <meta name="google-site-verification" content="fsLMOiigp5fIpCDMEVodQnQC7jIY1K3UXW5QkQcBmVs">
34
+
35
+ <link rel="alternate" href="android-app://jp.co.yahoo.android.yjtop/yahoojapan/home/top">
36
+
37
+ <link rel="alternate" media="only screen and (max-width: 640px)" href="https://m.yahoo.co.jp/">
38
+
39
+ <link rel="canonical" href="https://www.yahoo.co.jp/" />
40
+
41
+ <meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">
42
+
43
+ ```
12
44
 
13
45
 
14
46
 
47
+ 以下はURLからソースコードを習得するプログラムです
48
+
49
+ ```ここに言語を入力
50
+
51
+ import java.io.InputStream;
52
+
53
+ import java.io.InputStreamReader;
54
+
55
+ import java.net.URL;
56
+
57
+
58
+
59
+ public class Hero {
60
+
61
+
62
+
15
- public static void main(final String[] args){
63
+ public static void main(final String[] args){
16
64
 
17
65
  URL url = null;
18
66
 
@@ -22,7 +70,7 @@
22
70
 
23
71
  try {
24
72
 
25
- url = new URL("https://www.yahoo.co.jp/");
73
+ url = new URL("[リンク内容](https://www.yahoo.co.jp/)");
26
74
 
27
75
 
28
76
 
@@ -75,3 +123,13 @@
75
123
 
76
124
 
77
125
  }
126
+
127
+ ```
128
+
129
+ 質問
130
+
131
+ ---
132
+
133
+ 0. なぜ正確にHTMLを正確に読み込めないのか?
134
+
135
+ 0. どのようにすれば読み込めるようになるのか?