回答編集履歴

追記

2020/10/25 09:11

投稿

nto

スコア1438

answer CHANGED Viewed

@@ -9,13 +9,8 @@
 - tokyo_ramen_address.df.to_csv("tokyo_ramen_address.csv")
 + tokyo_ramen_address.df.to_csv("tokyo_ramen_address.csv", encoding='utf_8_sig')
 ```
-またアドバイスとしては、確認用のprintはscrape_item関数内で行うよりも
-make_df関数内で確認を行った方が[抽出出来ているか]と[正しい値であるか]を
-同時に確認する事ができて効率が良いでしょう。(雑な説明ですみません)
 ```python
 import requests
 from bs4 import BeautifulSoup
@@ -151,4 +146,18 @@
 if __name__ == '__main__':
 	tokyo_ramen_address = Tabelog(base_url="https://tabelog.com/tokyo/rstLst/ramen/",test_mode=False)
 	tokyo_ramen_address.df.to_csv("tokyo_ramen_address.csv", encoding='utf_8_sig')
-```
+```
+### 追記
+作成者が違う様で、質問者様に言っても仕方がない事では有ると思いますが
+確認用のprintはscrape_item関数内で行うよりも
+make_df関数内で確認を行った方が[抽出出来ているか]と[正しい値であるか]を
+同時に確認する事ができて効率が良いでしょう。(雑な説明ですみません)
+また`if store_head_list[0].text not in {'ラーメン', 'つけ麺'}:`の点についてですが
+店舗情報のヘッダー枠のジャンルという項目の１個目が[ラーメン]ではない場合に
+実際にラーメン屋であった場合でも除外されてしまっております。
+この場合の処理をもう少し柔軟に対応してあげられると更に精度が高まると思います。
+例:ジャンル: ラーメン▼担々麺▼　→　処理対象
+　 ジャンル: 担々麺▼ラーメン▼　→　除外対象