回答率: 85.29%

質問するログイン新規登録

トップ 3に関する質問 JAVAを使いURLからhtmlを読み込みたいです。

編集履歴

質問編集履歴

2

画像追加

2018/10/03 12:44

投稿

moment_now_love

スコア9

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -65,4 +65,7 @@
 質問
 ---
 0. なぜ正確にHTMLを正確に読み込めないのか？
-0. どのようにすれば読み込めるようになるのか？
+0. どのようにすれば読み込めるようになるのか？
+以下のようになってしまいます。
+![イメージ説明](fe2fb24db9f2417154fcc08bfe5ed538.jpeg)

1

説明の追加と文章追加

2018/10/03 12:44

投稿

moment_now_love

スコア9

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,16 +1,40 @@
+### 実現したいこと
-JAVAを使いURLからhtmlを読み込みたいです。
+**JAVAを使いURLからhtmlを読み込みたいです。**
+説明
+---
 以下のソースコードを実行したところ、簡単なサイトのhtmlは読み込めるのですが、ヤフーなどの複雑なサイトのhtmlを正確に読み取ることができません。
+正確に読み取れないとは以下のソースコードならば最後の行の「<meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">」
-１．なぜ読み込めないのか？
+この部分が読み込めてなかったりします。
-２・どのようにすれば読み込めるようになるのか？
+```ここに言語を入力
+<html lang="ja">
-ご回答よろしくお願いします。
+<head>
+<meta http-equiv="content-type" content="text/html; charset=utf-8">
+<meta http-equiv="content-style-type" content="text/css">
+<meta http-equiv="content-script-type" content="text/javascript">
+<meta name="description" content="日本最大級のポータルサイト。検索、オークション、ニュース、天気、スポーツ、メール、ショッピングなど多数のサービスを展開。あなたの生活をより豊かにする「課題解決エンジン」を目指していきます。">
+<meta name="robots" content="noodp">
+<meta name="google-site-verification" content="fsLMOiigp5fIpCDMEVodQnQC7jIY1K3UXW5QkQcBmVs">
+<link rel="alternate" href="android-app://jp.co.yahoo.android.yjtop/yahoojapan/home/top">
+<link rel="alternate" media="only screen and (max-width: 640px)" href="https://m.yahoo.co.jp/">
+<link rel="canonical" href="https://www.yahoo.co.jp/" />
+<meta property="og:title" content="Yahoo! JAPAN"><meta property="og:type" content="article">
+```
+以下はURLからソースコードを習得するプログラムです
+```ここに言語を入力
+import java.io.InputStream;
+import java.io.InputStreamReader;
+import java.net.URL;
+public class Hero {
-public static void main(final String[] args){
+	public static void main(final String[] args){
         URL url = null;
         InputStreamReader isr = null;
         try {
-            url = new URL("https://www.yahoo.co.jp/");
+            url = new URL("[リンク内容](https://www.yahoo.co.jp/)");
             // InputStream(バイトストリーム)のままでもHTMLは取得できるが文字化けする
             InputStream is = url.openStream();
@@ -36,4 +60,9 @@
             }
         }
-    }
+    }
+```
+質問
+---
+0. なぜ正確にHTMLを正確に読み込めないのか？
+0. どのようにすれば読み込めるようになるのか？