質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

1回答

2578閲覧

aspxで書かれたウェブページからscrapingが出来ません。

JumpeiTakubo

総合スコア8

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

1クリップ

投稿2017/05/24 05:49

###前提・実現したいこと
まずこのサイトのhtml文を文字列として認識したかったのですが、request.pyのなかで大量のエラーを吐きだれてしまいます。
link = 'http://rtais.wto.org/UI/PublicSearchByCrResult.aspx'
soup = bs4.BeautifulSoup(urllib.request.urlopen(link).read(), "lxml")
html = urlopen(link)

aspxで書かれたページをすくレーピングした経験があるかたいましたらアドバイスお願いします。
###発生している問題・エラーメッセージ

エラーメッセージ

###該当のソースコード

ここにご自身が実行したソースコードを書いてください

###試したこと
課題に対してアプローチしたことを記載してください

###補足情報(言語/FW/ツール等のバージョンなど)
より詳細な情報

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

エンコーディングを自動認識して文字列にしてくれる、requestsというサードパーティライブラリを使うと良いと思います。

import requests res = requests.get('http://rtais.wto.org/UI/PublicSearchByCrResult.aspx') print(res.text)

投稿2017/05/24 07:32

YouheiSakurai

総合スコア6142

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問