回答率: 85.31%

質問するログイン新規登録

トップに関する質問【Python】エラーの解決方法を教えてください

編集履歴

質問編集履歴

1

コードの訂正

2020/05/23 20:58

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -44,7 +44,105 @@
 ```ここに言語名を入力
+import requests
+import bs4
+import time
+import pandas as pd
+from tqdm import tqdm
+from google.colab import files
+def getSoup(page_number):
+Target_URL = "http://www.sakamotofoods.co.jp/webshop/&page=" + str(page_number)
+headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}
+response = requests.get(Target_URL, headers=headers)
+time.sleep(1)
+soup = bs4.BeautifulSoup(response.content, "html.parser")
+return soup
+def getData(URL):
+Target_URL = URL
+headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}
+response = requests.get(Target_URL, headers=headers)
+time.sleep(1)
+soup = bs4.BeautifulSoup(response.content, "html.parser")
+return soup
+def getDataframe(soup, df):
+entries = soup.find_all(class_ = "showcaseHd")
+for entry in entries:
+URL = entry.find("a")["href"]
+soup_second = getData(URL)
+se = pd.Series([
+soup_second.find("title").text, # Product Name
+soup_second.find_all(class_ = "tableType02")[1].find_all("tr")[6].find("td").text, # JAN
+], columns)
+df = df.append(se, columns)
-Python
+return df
+soup_info = getSoup(1)
+time.sleep(1)
+page_count_str = soup_info.find(class_ = "last").text.strip()
+page_count = int(page_count_str)
+print("\n")
+print("ページ数: " + str(page_count))
+columns = ["Product Name", "JAN"]
+df = pd.DataFrame(columns=columns)
+for page in tqdm(range(1, page_count + 1)):
+soup_info = getSoup(page)
+df = getDataframe(soup_info, df)
+df
 ```