6msというサイトの動画アフィリエイトコードをスクレイピングしたいんですが、一部取得できなくて困っています。
ちなみに、取得したいURLページの他の部分は取得できます。
htmlコードの一番下にある<iframe height="300"
width="300" src="https://6ms.biz/aff.php?
video_id=3522&aff_id=345074&site_id=336971" frameborder="0"
allowfullscreen=""></iframe>の部分を取得したいです。
どなたか教えて頂けると嬉しいです。
html
1<div class="p-videoDetail__inner"> 2 <div id="affiliate_info" style="display: block;"> 3 <div class="tab-content"> 4 <div id="affiliate_iframe" role="tabpanel" class="tab-pane active"> 5 <div class="form-group"> 6 <label for="formControlRange">広告幅 : <span id="show_width">300</span> 7 </label> 8 <input type="range" class="form-control-range" id="video_width" 9 min="100" max="900" step="1" value="300"> 10 </div> 11 <div class="form-group"> 12 <label for="formControlRange">広告高さ : <span 13 id="show_height">300</span></label> 14 <input type="range" class="form-control-range" id="video_height" 15 min="100" max="900" step="1" value="300"> 16 </div> 17 <div class="p-myPage__formGroup form-group form-material"> 18 <label class="p-myPage__formLabel" for="pre">埋め込み用のタグ</label> 19 <button type="button" class="btn btn-default btn-sm u-mb10" 20 id="iframe_copy">Copy</button> 21 <pre style="padding:10px; white-space:pre-wrap; overflow-x:hidden;" 22 id="pre_iframe"> 23 "<iframe height="300" 24 width="300" src="https://6ms.biz/aff.php? 25 video_id=3522&aff_id=345074&site_id=336971" frameborder="0" 26 allowfullscreen=""></iframe> 27 </pre> 28 </div> 29 </div>
試したpythonコード1
結果None
python
1url = 'https://6ms.biz/video/3522/' 2session = requests.session() 3soup = BeautifulSoup(session.get(url).content, 'lxml') 4movie = soup.find_all('pre', id='pre_iframe').contents[0]
試したコード2
結果AttributeError: ResultSet object has no attribute 'find_all'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?
python
1url = 'https://6ms.biz/video/3522/' 2session = requests.session() 3soup = BeautifulSoup(session.get(url).content, 'lxml') 4m = soup.find_all('div', class_="p-videoDetail__inner") 5m = mall.find_all('div', id="affiliate_info") 6m_m = m.find_all('div', class_="tab-content") 7movie = m_m.find('pre', id="pre_iframe")
日本語の文では iframe タグを取得したいと書いてあるのに、コードでは preタグを取得しようとしていますが、
・文章の書き間違い
・コードのコピペミス
のどちらかを正しく直しましょう。
コードを修正しました。
preタグの下に#textで<iframe>が記載されていたので、上記のような文章で質問しました。
まだ何か修正する点がありましたら、教えてください!よろしくお願いします。
ああ、preタグのテキストを取得したいと言うことだったんですか。
コード1はどういう結果だったのでしょう?
コード2のエラーについては、メッセージの通りです。
コードミスと、文章が足りていなくてすみません。
コード1はNoneで返ってきました。
HTMLがこの通りだとすると、<iframe~~ はテキストじゃ無くてタグなので、
preタグのテキストを取り出すと言うことでは取得できません。
iframeタグを取得することになります。
movie = soup.find('iframe', id='pre_iframe')で試してみたところ、Noneで返ってきました。
あなたの回答
tips
プレビュー