回答編集履歴

2

追記

2025/01/14 02:48

投稿

bsdfan
bsdfan

スコア4818

test CHANGED
@@ -1,3 +1,7 @@
1
+ エラーについてはコメントで書いたように、どこかで `html = requests.get(...)` みたいなのを実行して、html という変数に Response 型のものをセットしているためでしょう。それによって lxml から import した html が使えなくなっています。
2
+
3
+ 以下は、こうしたほうがいいんじゃないか、という内容です。
4
+
1
5
  疑似要素というのがどこのことを指しているのかよくわからないのですが、XPathでルートからフルパスで要素を指定するよりも、html を構造的に考えて、要素名やclassやidといったもので絞り込んでやるほうが、わかりやすくなると思います。
2
6
  今回のケースだと、`<ul class=classCourseSyokin>` の下の `<li>` の1番目ということで要素が特定できると思います。
3
7
  ```python

1

誤記修正

2025/01/13 06:22

投稿

bsdfan
bsdfan

スコア4818

test CHANGED
@@ -3,7 +3,7 @@
3
3
  ```python
4
4
  tree = html.fromstring(web_content)
5
5
  elements = tree.xpath('//ul[contains(@class,"classCourseSyokin")]/li')
6
- print(element[0].text_content())
6
+ print(elements[0].text_content())
7
7
  # 2歳オープン (国) 牡・牝 (指) 馬齢
8
8
  ```
9
9