pythonでsuumo中古物件サイトのスクレイピングに関しての質問です。
以下のhtmlから物件名のみを取得したいのですが、価格まで抽出してしまいます。ウェブサイトなどいくつか参照したのですが、解決方法がわからず・・・
わかる方ぜひご教授していただけると幸いです。初歩的な質問になってしまい申し訳ありません。
python
1<dl> 2 <dt class="dottable-vm">物件名</dt> 3 <dd class="dottable-vm">シティインデックス千代田岩本町</dd> 4</dl> 5 <dl> 6 <span class="dottable-value">4080万円</span><dt class="dottable-vm">販売価格</dt> 7 <dd class="dottable-vm"> 8 </dd> 9</dl> 10 11コード 12import requests as re 13import pandas as pd 14from bs4 import BeautifulSoup 15url = 'https://suumo.jp/jj/bukken/ichiran/JJ012FC001/?ar=030&bs=011&ta=13&sc=13101&cn=9999999&cnb=0&et=9999999&hb=0&ht=9999999&kb=1&kj=9&km=1&kt=9999999&mb=0&mt=9999999&ni=9999999&pc=30&pj=1&po=0&tb=0&tj=0&tt=9999999' 16 17res = re.get(url) 18soup = BeautifulSoup(res.text,'lxml') 19u=soup.find_all('dd',class_='dottable-vm') 20 21 22実行結果>>>>[<dd class="dottable-vm">シティインデックス千代田岩本町</dd>, 23 <dd class="dottable-vm"> 24 <span class="dottable-value">4080万円</span> 25 </dd>
HTMLと実行結果が合ってません。
回答1件
あなたの回答
tips
プレビュー