質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

servlet

Servletとは、Webページの動的な生成やデータ処理などをサーバ上で実行するために、Javaで作成されたプログラムです。 ショッピングサイトやオンラインバンキングといった、動的なウェブサイトの構築に用いられています。

Tomcat

TomcatはApache Software Foundation (ASF)で開発されたオープンソースのWebコンテナです。

Q&A

解決済

1回答

3876閲覧

jsoupのservlet内での挙動とMainでの挙動の違い

anonymous001

総合スコア96

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

servlet

Servletとは、Webページの動的な生成やデータ処理などをサーバ上で実行するために、Javaで作成されたプログラムです。 ショッピングサイトやオンラインバンキングといった、動的なウェブサイトの構築に用いられています。

Tomcat

TomcatはApache Software Foundation (ASF)で開発されたオープンソースのWebコンテナです。

0グッド

1クリップ

投稿2014/12/16 15:57

lang

1 public static void main(String[] args) { 2 try { 3 Document document = Jsoup.connect("http://www.sdmemo.com/wiki/Review_Board%E3%81%AE%E5%B0%8E%E5%85%A5%E6%89%8B%E9%A0%86").get(); 4 String a = document.getElementsByTag("title").toString(); 5 } catch (IOException e) { 6 e.printStackTrace(); 7 8 }

このときはには

lang

1a = "Review Boardの導入手順 - Software Development Memo"

と想定通りの結果になるのですが、
これをtomcat起動してservlet内で読み込むと、

lang

1org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404,

が返ります
どういった違いで変化が出るのでしょうか。尚エンコードのされてない普通のサイトだと、servlet内でも
想定の挙動してくれます

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

jsoup 1.7.2, Tomcat7, JDK7で試しましたが、どちらも正常にタイトルが取得されました。
文字エンコーディングはすべてUTF-8にしています。

ただし、結果はタグが付いた状態で取得されました。

a = <title>Review Boardの導入手順 - Software Development Memo</title>

jsoupのバージョンが違うのかもしれません。

投稿2014/12/17 04:30

argius

総合スコア9388

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

anonymous001

2014/12/17 15:48

jsoup 1.7.2, Tomcat7, JDK7 のバージョンでやってみましたが404エラーが帰ってきました。実行をもうすこし詳しく書くとurlパラメータに対象URLを入れてGETメソッドに乗せます String url = request.getParameter("url"); で取得して Document document = Jsoup.connect(url).get()という感じです。 どのような感じで検証されたのか教えていただけませんか?m(__)m
argius

2014/12/17 16:23

検証は、サンプルのmainメソッドを、そのままdoGetから呼び出して確認しました。 URLをGETパラメーターで渡しているということですが、GETでURLエンコードした文字列を渡してrequest.getParameter("url")で取得すると、その文字列はURLデコードされています。デバッグかSystem.out.printlnで確認してみてください。 GETパラメーターに渡すURLは、下記のように、再度URLエンコードしたものを設定する必要があります。 url=http%3A%2F%2Fwww.sdmemo.com%2Fwiki%2FReview_Board%25E3%2581%25AE%25E5%25B0%258E%25E5%2585%25A5%25E6%2589%258B%25E9%25A0%2586
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問