すいません。
pythonの土素人でございます。
python2.7系とbs4を使って開発しております。
PHPやRubyだと数十分でスクレイピング出来たのですが、
pythonだとうまくいきません。。
sの中身が、
[<span class="display-name">\u3055\u3044\u3068\u3046</span>]
で吐き出されてるっぽいんのです。。
ちなみにコードです.
# coding=UTF-8 from bs4 import BeautifulSoup import re import urllib2 import sys url = urllib2.urlopen("http://tabelog.com/tokyo/A1308/A130802/13015251/").read() soup = BeautifulSoup(url, "html.parser") s = soup.find_all(class_="display-name") print s
さいとう
っていうのを吐き出したいのです。
お助けお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2015/07/08 04:46
2015/07/08 05:10
2015/07/08 05:13
2015/07/08 05:21