回答編集履歴

1

コード部分修正

2017/11/23 04:08

投稿

wakame
wakame

スコア1170

test CHANGED
@@ -1,22 +1,66 @@
1
- まずド引用元をコピーして動作確認してはいかがでしょうか?
1
+ まずエラが発生する箇所までで動作するかチェックしてみましょう
2
2
 
3
- 下記部分に分がでているようです
3
+ ライブラリのversion等の環境の差で発生しているエラーがあるかもしれません
4
4
 
5
5
  ```python
6
6
 
7
- # 引用元
7
+ from bs4 import BeautifulSoup
8
8
 
9
- soup = BeautifulSoup(c,"html.parser")
9
+ import requests
10
10
 
11
+ import pandas as pd
12
+
13
+ from pandas import Series, DataFrame
14
+
11
- ```
15
+ import time
12
16
 
13
17
 
14
18
 
15
- ```python
19
+ # URL(東京都足立区の賃貸住宅情報 検索結果の1ページ目)
16
20
 
17
- # 質問者様該当部分
21
+ url = 'http://suumo.jp/jj/chintai/ichiran/FR301FC001/?ar=030&bs=040&ta=13&sc=13121&cb=0.0&ct=9999999&et=9999999&cn=9999999&mb=0&mt=9999999&shkr1=03&shkr2=03&shkr3=03&shkr4=03&fw2=&srch_navi=1'
18
22
 
23
+
24
+
25
+ # データ取得
26
+
27
+ result = requests.get(url)
28
+
29
+ c = result.content
30
+
31
+
32
+
33
+ # HTMLを元に、オブジェクトを作る
34
+
19
- soup = BeautifulSoup(c)
35
+ soup = BeautifulSoup(c, "html.parser")
36
+
37
+
38
+
39
+ # 物件リストの部分を切り出し
40
+
41
+ summary = soup.find("div", {'id': 'js-bukkenList'})
42
+
43
+
44
+
45
+ # ページ数を取得
46
+
47
+ body = soup.find("body")
48
+
49
+ pages = body.find_all("div", {'class': 'pagination pagination_set-nav'})
50
+
51
+ pages_text = str(pages)
52
+
53
+ pages_split = pages_text.split('</a></li>\n</ol>')
54
+
55
+ pages_split0 = pages_split[0]
56
+
57
+ pages_split1 = pages_split0[-3:]
58
+
59
+ pages_split2 = pages_split1.replace('>', '')
60
+
61
+ pages_split3 = int(pages_split2)
62
+
63
+ print(pages_split3)
20
64
 
21
65
  ```
22
66