回答率: 85.48%

質問するログイン新規登録

トップ Pythonに関する質問 pythonのValueErrorについて

編集履歴

回答編集履歴

1

コード部分修正

2017/11/23 04:08

投稿

スコア1170

test CHANGED Viewed

@@ -1,22 +1,66 @@
-まずコード引用元をコピーして動作確認してはいかがでしょうか？
+まずエラーが発生する箇所までで動作するかチェックしてみましょう。
-下記部分に差分がでているようです。
+ライブラリのversion等の環境の差で発生しているエラーがあるかもしれません。
 ```python
-# 引用元
+from bs4 import BeautifulSoup
-soup = BeautifulSoup(c,"html.parser")
+import requests
+import pandas as pd
+from pandas import Series, DataFrame
-```
+import time
-```python
+# URL（東京都足立区の賃貸住宅情報 検索結果の1ページ目）
-# 質問者様該当部分
+url = 'http://suumo.jp/jj/chintai/ichiran/FR301FC001/?ar=030&bs=040&ta=13&sc=13121&cb=0.0&ct=9999999&et=9999999&cn=9999999&mb=0&mt=9999999&shkr1=03&shkr2=03&shkr3=03&shkr4=03&fw2=&srch_navi=1'
+# データ取得
+result = requests.get(url)
+c = result.content
+# HTMLを元に、オブジェクトを作る
-soup = BeautifulSoup(c)
+soup = BeautifulSoup(c, "html.parser")
+# 物件リストの部分を切り出し
+summary = soup.find("div", {'id': 'js-bukkenList'})
+# ページ数を取得
+body = soup.find("body")
+pages = body.find_all("div", {'class': 'pagination pagination_set-nav'})
+pages_text = str(pages)
+pages_split = pages_text.split('</a></li>\n</ol>')
+pages_split0 = pages_split[0]
+pages_split1 = pages_split0[-3:]
+pages_split2 = pages_split1.replace('>', '')
+pages_split3 = int(pages_split2)
+print(pages_split3)
 ```