質問するログイン新規登録

回答編集履歴

1

書き直し

2019/01/20 11:55

投稿

firedfly
firedfly

スコア1133

answer CHANGED
@@ -1,6 +1,24 @@
1
- にちは
1
+ すいません。勘違いしていました。
2
+ 確かに建物名は<p>がついておらずバグっぽい。
3
+ <li>のtextとして取れはしますが汎用的でないですね。
2
4
 
3
- <p>も立派なタグで、classは必須ではないです。
5
+ ```Python
4
- 以下を参考にして取得してみて下さい。
6
+ import lxml.html
5
7
 
8
+ response = """
9
+ <li class="transact-info-table-row">
10
+ <span class="transact-info-table-cell">お届け先</span>
11
+ <ul class="transact-info-table-cell">
12
+ <li>
13
+ <p>〒xxx-xxxx</p>
14
+ <p>東京都xxxxxxx</p>
15
+ <p></p>○x△マンション10z号室
16
+ <p><span class="buyer-name">aaa bbb</span> 様</p>
17
+ </li>
18
+ </ul>
19
+ </li>
20
+ """
21
+ html = lxml.html.fromstring(response)
22
+
6
- [Seleniumで要素を選択する方法まとめ - Qiita](https://qiita.com/VA_nakatsu/items/0095755dc48ad7e86e2f)
23
+ print(html.xpath("//ul/li/text()"))
24
+ ```