###PythonでのWebスクレイピング
簡単なWebサイトのスクレイピングはできたものの、JavascriptでレンダリングされているようなWebページでのスクレイピングで苦戦中です。
###発生している問題
今、某魚拓サイトをスクレイピングしようとしています。
挑戦中のWebページは以下のページです。(スクレイピング先の内容に特に意味はないです……)
ページ:http://megalodon.jp/2014-0421-0310-13/sucrose.hatenablog.com/entry/2014/04/21/000909
該当Webページの<iframe ...> (魚拓部分) </iframe>の中身を取ってきたいのですが、素直にソースコードを持ってきてもダメなようです。
具体的には、以下のソースのように持ってきても<iframe...></iframe>と中身が入っていない状態で返ってきてしまうようです。
上手いやり方を知っている方、ご教授願いませんか?
###該当のソースコード
python
1from selenium import webdriver 2import lxml.html 3 4url = "http://megalodon.jp/2014-0421-0310-13/sucrose.hatenablog.com/entry/2014/04/21/000909" 5driver = webdriver.PhantomJS() 6driver.get(url) 7// driver.page_sourceからすでにiframe内にはないようです 8htmls = lxml.html.fromstring(driver.page_source) 9sources = htmls.cssselect('iframe') 10for source in sources: 11 print(source.text)
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。