回答編集履歴
2
追記
test
CHANGED
@@ -1,3 +1,7 @@
|
|
1
|
+
エラーについてはコメントで書いたように、どこかで `html = requests.get(...)` みたいなのを実行して、html という変数に Response 型のものをセットしているためでしょう。それによって lxml から import した html が使えなくなっています。
|
2
|
+
|
3
|
+
以下は、こうしたほうがいいんじゃないか、という内容です。
|
4
|
+
|
1
5
|
疑似要素というのがどこのことを指しているのかよくわからないのですが、XPathでルートからフルパスで要素を指定するよりも、html を構造的に考えて、要素名やclassやidといったもので絞り込んでやるほうが、わかりやすくなると思います。
|
2
6
|
今回のケースだと、`<ul class=classCourseSyokin>` の下の `<li>` の1番目ということで要素が特定できると思います。
|
3
7
|
```python
|
1
誤記修正
test
CHANGED
@@ -3,7 +3,7 @@
|
|
3
3
|
```python
|
4
4
|
tree = html.fromstring(web_content)
|
5
5
|
elements = tree.xpath('//ul[contains(@class,"classCourseSyokin")]/li')
|
6
|
-
print(element[0].text_content())
|
6
|
+
print(elements[0].text_content())
|
7
7
|
# 2歳オープン (国) 牡・牝 (指) 馬齢
|
8
8
|
```
|
9
9
|
|