質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

iframe

HTMLのタグ<iframe>です。<iframe>は、ドキュメント内に""inline frame""を作るHTML要素で、同じページでセパレートしているドキュメントが表示されるようにします。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

11829閲覧

Pythonでスクレイピング : iframe内の要素

RyuSA

総合スコア131

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

iframe

HTMLのタグ<iframe>です。<iframe>は、ドキュメント内に""inline frame""を作るHTML要素で、同じページでセパレートしているドキュメントが表示されるようにします。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

1クリップ

投稿2017/02/28 14:32

編集2017/02/28 14:53

###PythonでのWebスクレイピング
簡単なWebサイトのスクレイピングはできたものの、JavascriptでレンダリングされているようなWebページでのスクレイピングで苦戦中です。

###発生している問題
今、某魚拓サイトをスクレイピングしようとしています。
挑戦中のWebページは以下のページです。(スクレイピング先の内容に特に意味はないです……)

ページ:http://megalodon.jp/2014-0421-0310-13/sucrose.hatenablog.com/entry/2014/04/21/000909

該当Webページの<iframe ...> (魚拓部分) </iframe>の中身を取ってきたいのですが、素直にソースコードを持ってきてもダメなようです。
具体的には、以下のソースのように持ってきても<iframe...></iframe>と中身が入っていない状態で返ってきてしまうようです。

上手いやり方を知っている方、ご教授願いませんか?

###該当のソースコード

python

1from selenium import webdriver 2import lxml.html 3 4url = "http://megalodon.jp/2014-0421-0310-13/sucrose.hatenablog.com/entry/2014/04/21/000909" 5driver = webdriver.PhantomJS() 6driver.get(url) 7// driver.page_sourceからすでにiframe内にはないようです 8htmls = lxml.html.fromstring(driver.page_source) 9sources = htmls.cssselect('iframe') 10for source in sources: 11 print(source.text)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

すみません、間違えました。

投稿2019/05/27 04:46

編集2019/05/27 04:49
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

iframeは、このタグ内で別のHTMLを呼び出しています。

つまり、以下の処理で、iframeの要素を取得して、そこから、srcに書かれているURLを入手します。
sources = htmls.cssselect('iframe')

その後、再度、iframeの内部のHTMLを入手し解析する必要があります。

投稿2017/03/02 07:23

terapyon

総合スコア313

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問