質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

0回答

760閲覧

スクレイピング一部取得できないのでどなたか教えてください

monmon2

総合スコア17

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2021/10/21 13:09

編集2021/10/21 14:27

6msというサイトの動画アフィリエイトコードをスクレイピングしたいんですが、一部取得できなくて困っています。
ちなみに、取得したいURLページの他の部分は取得できます。
htmlコードの一番下にある<iframe height="300" width="300" src="https://6ms.biz/aff.php? video_id=3522&amp;aff_id=345074&amp;site_id=336971" frameborder="0" allowfullscreen=""></iframe>の部分を取得したいです。

どなたか教えて頂けると嬉しいです。

html

1<div class="p-videoDetail__inner"> 2 <div id="affiliate_info" style="display: block;"> 3 <div class="tab-content"> 4 <div id="affiliate_iframe" role="tabpanel" class="tab-pane active"> 5 <div class="form-group"> 6 <label for="formControlRange">広告幅 : <span id="show_width">300</span> 7 </label> 8 <input type="range" class="form-control-range" id="video_width" 9 min="100" max="900" step="1" value="300"> 10 </div> 11 <div class="form-group"> 12 <label for="formControlRange">広告高さ : <span 13 id="show_height">300</span></label> 14 <input type="range" class="form-control-range" id="video_height" 15 min="100" max="900" step="1" value="300"> 16 </div> 17 <div class="p-myPage__formGroup form-group form-material"> 18 <label class="p-myPage__formLabel" for="pre">埋め込み用のタグ</label> 19 <button type="button" class="btn btn-default btn-sm u-mb10" 20 id="iframe_copy">Copy</button> 21 <pre style="padding:10px; white-space:pre-wrap; overflow-x:hidden;" 22 id="pre_iframe"> 23 "<iframe height="300" 24 width="300" src="https://6ms.biz/aff.php? 25 video_id=3522&amp;aff_id=345074&amp;site_id=336971" frameborder="0" 26 allowfullscreen=""></iframe> 27 </pre> 28 </div> 29 </div>

試したpythonコード1
結果None

python

1url = 'https://6ms.biz/video/3522/' 2session = requests.session() 3soup = BeautifulSoup(session.get(url).content, 'lxml') 4movie = soup.find_all('pre', id='pre_iframe').contents[0]

試したコード2
結果AttributeError: ResultSet object has no attribute 'find_all'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

python

1url = 'https://6ms.biz/video/3522/' 2session = requests.session() 3soup = BeautifulSoup(session.get(url).content, 'lxml') 4m = soup.find_all('div', class_="p-videoDetail__inner") 5m = mall.find_all('div', id="affiliate_info") 6m_m = m.find_all('div', class_="tab-content") 7movie = m_m.find('pre', id="pre_iframe")

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2021/10/21 14:20

日本語の文では iframe タグを取得したいと書いてあるのに、コードでは preタグを取得しようとしていますが、 ・文章の書き間違い ・コードのコピペミス のどちらかを正しく直しましょう。
monmon2

2021/10/21 14:29

コードを修正しました。 preタグの下に#textで<iframe>が記載されていたので、上記のような文章で質問しました。 まだ何か修正する点がありましたら、教えてください!よろしくお願いします。
otn

2021/10/21 14:39

ああ、preタグのテキストを取得したいと言うことだったんですか。 コード1はどういう結果だったのでしょう? コード2のエラーについては、メッセージの通りです。
monmon2

2021/10/21 14:47

コードミスと、文章が足りていなくてすみません。 コード1はNoneで返ってきました。
otn

2021/10/21 15:07

HTMLがこの通りだとすると、<iframe~~ はテキストじゃ無くてタグなので、 preタグのテキストを取り出すと言うことでは取得できません。 iframeタグを取得することになります。
monmon2

2021/10/21 15:12

movie = soup.find('iframe', id='pre_iframe')で試してみたところ、Noneで返ってきました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問