python スクレイピングに関しての質問です。

pythonでsuumo中古物件サイトのスクレイピングに関しての質問です。
以下のhtmlから物件名のみを取得したいのですが、価格まで抽出してしまいます。ウェブサイトなどいくつか参照したのですが、解決方法がわからず・・・
わかる方ぜひご教授していただけると幸いです。初歩的な質問になってしまい申し訳ありません。

python
1<dl>
2	<dt class="dottable-vm">物件名</dt>
3	<dd class="dottable-vm">シティインデックス千代田岩本町</dd>
4</dl>
5 <dl>
6	<span class="dottable-value">4080万円</span><dt class="dottable-vm">販売価格</dt>
7	<dd class="dottable-vm">
8	</dd>
9</dl>
10
11コード
12import requests as re
13import pandas as pd
14from bs4 import BeautifulSoup
15url = 'https://suumo.jp/jj/bukken/ichiran/JJ012FC001/?ar=030&bs=011&ta=13&sc=13101&cn=9999999&cnb=0&et=9999999&hb=0&ht=9999999&kb=1&kj=9&km=1&kt=9999999&mb=0&mt=9999999&ni=9999999&pc=30&pj=1&po=0&tb=0&tj=0&tt=9999999'
16
17res = re.get(url)
18soup = BeautifulSoup(res.text,'lxml')
19u=soup.find_all('dd',class_='dottable-vm')
20
21
22実行結果>>>>[<dd class="dottable-vm">シティインデックス千代田岩本町</dd>,
23 <dd class="dottable-vm">
24 <span class="dottable-value">4080万円</span>
25 </dd>

otn

2021/10/06 00:16

HTMLと実行結果が合ってません。

行動規範の内容に同意します

回答1件

ベストアンサー

安直にやるのであれば、
u 変数の偶数Index目に物件名、奇数Index目に価格が入っているので
↓で取得できないでしょうか？

もっと効率の良いやり方はあると思うのですが、取り急ぎであればお役に立てるかと思います

python
1import requests as re
2import pandas as pd
3from bs4 import BeautifulSoup
4url = 'https://suumo.jp/jj/bukken/ichiran/JJ012FC001/?ar=030&bs=011&ta=13&sc=13101&cn=9999999&cnb=0&et=9999999&hb=0&ht=9999999&kb=1&kj=9&km=1&kt=9999999&mb=0&mt=9999999&ni=9999999&pc=30&pj=1&po=0&tb=0&tj=0&tt=9999999'
5
6res = re.get(url)
7soup = BeautifulSoup(res.text,'lxml')
8u=soup.find_all('dd',class_='dottable-vm')
9
10for i in range(0,len(u)):
11  if i%2 == 0:
12    print(u[i])
13