以下のようなhtmlの中で
<span>ストーリー</span>
から
<span>キャスト</span>
間のデータをpythonを利用して取得したいですが、
どのように実装すればよいかわかりません。
何かヒントになることがありましたら教えていただけますでしょうか。
xx.html
<html> <body> <span class="mw-headline" id=".E3.82.B9.E3.83.88.E3.83.BC.E3.83.AA.E3.83.BC">ストーリー</span> <span></span> <p> xxx xxx </p> <span></span> <span class="mw-headline" id=".E3.82.AD.E3.83.A3.E3.82.B9.E3.83.88">キャスト</span> </body> </html>
現在はbeautifulsoupを使って実装しようと思いますが、別の方法でもかまいません。
beautifulsoupでの実装だと以下のような流れになるかと思いますが、findAllのとこからつまってます。
from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("xx.html") bsObj = BeautifulSoup(html, "html.parser") nameList = bsObj.findAll....
皆さんの知恵を貸してください。
よろしくお願いします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/02/05 12:07
2017/02/05 12:28