###前提・実現したいこと
pythonでhtmlをパースしたい
###発生している問題・エラーメッセージ
(1)
[u'\u897f']
と表示される。("西南西"等の日本語の方角を期待していた)
(2)
chrome上でF12を押して、対象タグ上で右クリック、xpath出力すると、
//*[@id="bd"]/div[1]/table/tbody/tr[17]/td[13]/
となります。(tbodyが入っている)
但しこれをxpathとして指定しても要素を取得することができません。([]となる)
どのパスを指定するのが正解ですか?
###該当のソースコード
from urllib2 import * import lxml.html html2 = urlopen('http://www.tenki.jp/live/5/26/47636.html').read() root2 = lxml.html.fromstring(html2) t1 = root2.xpath('//*[@id="bd"]/div[1]/table/tr[17]/td[13]/text()') print t1
###試したこと
print t1.encode('utf_8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'list' object has no attribute 'encode'
###補足情報(言語/FW/ツール等のバージョンなど)
CentOS release 6.7
Python 2.6.6
lxml
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/05/04 10:25