前提・実現したいこと
pythonでクローラ作成しようとしています。
requestsを使ってページの構造を取得しようとしたのですが、目当ての項目を抽出しようとしたところ
何も返ってきませんでした。
取得した中身を見たところ実際のページの構造と違うように見えるのですが、ちゃんと抽出するためには
どのようにすればよいでしょうか。
なぜページの一部が返ってこないという現象が起きるのでしょうか。
該当のソースコード
import requests import csv import time from bs4 import BeautifulSoup as bs url = "https://hogehoge" response = requests.get(url) html = bs(response.text, "lxml")
試したこと
ページ構造はchromeの「検証」、「ページのソースを表示」両方に目当ての記述があるのを確認してます。 html = bs(response.text, "html.parser") html = bs(response.text, "lxml-xml") html = bs(response.text, "html5lib") →パースの仕方かと思って色々試しましたが、そもそもresponse.textの状態で 抽出したい項目が入ってませんでした。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。