回答編集履歴

コード修正

2021/10/31 03:26

投稿

スコア752

answer CHANGED Viewed

@@ -77,6 +77,6 @@
 import pandas as pd
 # [[shopの社名, shopの住所, shopのTEL], [...], ...]に変換
-data = [[shop['name'], shop['address'], shop['tel'] for shop in shops]
+data = [[shop['name'], shop['address'], shop['tel']] for shop in shops]
 df = pd.DataFrame(data, columns=['社名', '住所', 'TEL'])
 ```

コード修正

2021/10/31 03:26

投稿

スコア752

answer CHANGED Viewed

@@ -41,7 +41,7 @@
             address = shop_el.find('p', attrs={'class': 'shop_address'})
             if address:
                 shop['address'] = address.text
-            tel = shop_el.find('p', attrs = {'class':'shop_tel'})
+            tel = shop_el.find('p', attrs={'class':'shop_tel'})
             if tel:
                 shop['tel'] = tel.text
             shops.append(shop)

表記修正

2021/10/27 08:12

投稿

スコア752

answer CHANGED Viewed

@@ -61,9 +61,9 @@
 shops = flatten([get_shops(url) for url in urls])
 ```
-`get_shops()`では`shop`ごとに`{'name': '...', 'address': '...', 'tel': '...'}`という辞書を作ってその配列を返すようにしています。
+`get_shops()`では`shop`ごとに`{'name': '...', 'address': '...', 'tel': '...'}`という辞書を作ってそのリストを返すようにしています。
-`name`/`address`/`tel`それぞれの配列がほしければ以下のようにしましょう。
+`name`/`address`/`tel`それぞれのリストがほしければ以下のようにしましょう。
 ```python
 names   = [shop['name'] for shop in shops]

誤字修正

2021/10/27 08:09

投稿

スコア752

answer CHANGED Viewed

@@ -1,6 +1,6 @@
 2ページ目のURLを見てみると`https://el.e-shops.jp/local/jb/6008/jn/6000523/cn/23109/2.html`のように末尾に`2.html`が付いています。別の区の3ページ目も確認すると末尾が`3.html`でした。
-ということは`base_url`を`https://el.e-shops.jp/local/jb/6008/jn/6000523/cn/23109/`とすると、1ページ目は`base_url + '2.html'`、3ページ目は`base_url + '3.html'`……となっているわけです。
+ということは`base_url`を`https://el.e-shops.jp/local/jb/6008/jn/6000523/cn/23109/`とすると、2ページ目は`base_url + '2.html'`、3ページ目は`base_url + '3.html'`……となっているわけです。
 そして、最後のページの次のページ（例えば`https://el.e-shops.jp/local/jb/6008/jn/6000523/cn/23109/3.html`）を見てみると、`.list-tel-shop`という要素がないページが表示されます。

dataframeへの変換を追記

2021/10/27 08:08

投稿

スコア752

answer CHANGED Viewed

@@ -69,4 +69,14 @@
 names   = [shop['name'] for shop in shops]
 address = [shop['address'] for shop in shops]
 tels    = [shop['tel'] for shop in shops]
+```
+これらを一列づつ追加してもいいですが、一気に`pd.Dataframe`にした方がいい気がします。
+```python
+import pandas as pd
+# [[shopの社名, shopの住所, shopのTEL], [...], ...]に変換
+data = [[shop['name'], shop['address'], shop['tel'] for shop in shops]
+df = pd.DataFrame(data, columns=['社名', '住所', 'TEL'])
 ```

説明とコードを追記

2021/10/27 08:07

投稿

スコア752

answer CHANGED Viewed

@@ -61,4 +61,12 @@
 shops = flatten([get_shops(url) for url in urls])
 ```
-`get_shops()`では`shop`ごとに`{'name': '...', 'address': '...', 'tel': '...'}`という辞書を作ってその配列を返すようにしています。
+`get_shops()`では`shop`ごとに`{'name': '...', 'address': '...', 'tel': '...'}`という辞書を作ってその配列を返すようにしています。
+`name`/`address`/`tel`それぞれの配列がほしければ以下のようにしましょう。
+```python
+names   = [shop['name'] for shop in shops]
+address = [shop['address'] for shop in shops]
+tels    = [shop['tel'] for shop in shops]
+```