回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップスクレイピングに関する質問

Q&A

解決済

2回答

850閲覧

requestsとBeautifulSoupでのスクレイピングがうまくいきません

総合スコア81

0グッド

0クリップ

投稿2020/03/29 17:09

0

0

requestsとBeautifulSoupを利用して、以下のようにAtCoderの関連サイトからテーブルを取得して、勉強用の一覧を作ろうとしています。

Python
1URL = "https://kenkoooo.com/atcoder/#/table/"
2res = requests.get(URL)
3
4soup = BeautifulSoup(res.content, "html.parser") 
5table_data = soup.find_all('tr')

コードの一部ですが、最下段での取得がうまくいきません。そもそも、requestsで取ってきているHTMLのデータ構造が意図しているものと違うように思います。webサイトのすべてのソースコードがとれていないように思うのですが、一体これはどういうことなのでしょうか。どうすると全てのデータが取れるのでしょう。

2020/03/30 00:44

どういうデータ構造を意図していて、どう違っているのでしょうか？それが分からないと回答しようがないと思いますので、質問欄へ追記をお願いします。

行動規範の内容に同意します

回答2件

0

取得先の利用規約的にスクレイピングしちゃっていいんですか？

投稿2020/03/29 18:14

退会済みユーザー

総合スコア0

0

ベストアンサー

質問があやふやなのは修正依頼通り、利用規約も要確認だとして、
とりあえず想像でお答えすると
requestsでの取得ではjavascriptが動かないので、大抵ブラウザでの表示と同じ結果にはなりません。
ブラウザと同じ結果を取得したい場合Selenium等のツールを使う必要があります。

投稿2020/03/30 01:17

総合スコア88

2020/03/30 01:48

ありがとうございます。ご指摘の通りでした。利用規約は作業前に調べたのですが、それらしき記載がなかったため、サーバに負荷をかけない程度であれば良いものと考えました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップスクレイピングに関する質問

requestsとBeautifulSoupでのスクレイピングがうまくいきません

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る