回答編集履歴

1

書き直し

2019/01/20 11:55

投稿

firedfly
firedfly

スコア1133

test CHANGED
@@ -1,11 +1,47 @@
1
- にちは
1
+ すいません。勘違いしていました。
2
+
3
+ 確かに建物名は<p>がついておらずバグっぽい。
4
+
5
+ <li>のtextとして取れはしますが汎用的でないですね。
2
6
 
3
7
 
4
8
 
5
- <p>も立派なタグで、classは必須ではないです。
9
+ ```Python
6
10
 
7
- 以下を参考にして取得してみて下さい。
11
+ import lxml.html
8
12
 
9
13
 
10
14
 
15
+ response = """
16
+
17
+ <li class="transact-info-table-row">
18
+
19
+ <span class="transact-info-table-cell">お届け先</span>
20
+
21
+ <ul class="transact-info-table-cell">
22
+
23
+ <li>
24
+
25
+ <p>〒xxx-xxxx</p>
26
+
27
+ <p>東京都xxxxxxx</p>
28
+
29
+ <p></p>○x△マンション10z号室
30
+
31
+ <p><span class="buyer-name">aaa bbb</span> 様</p>
32
+
33
+ </li>
34
+
35
+ </ul>
36
+
37
+ </li>
38
+
39
+ """
40
+
41
+ html = lxml.html.fromstring(response)
42
+
43
+
44
+
11
- [Seleniumで要素を選択する方法まとめ - Qiita](https://qiita.com/VA_nakatsu/items/0095755dc48ad7e86e2f)
45
+ print(html.xpath("//ul/li/text()"))
46
+
47
+ ```