回答率: 85.35%

質問するログイン新規登録

トップに関する質問 python エクセル一括出力方法

編集履歴

質問編集履歴

1

詳細を記載

2020/03/30 09:32

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -18,9 +18,53 @@
 ```python
-# 各データをデータフレームに格納
+import requests
+import pandas as pd
+from google.colab import files
+from bs4 import BeautifulSoup
+def f1(url, suffix):
+    response = requests.get(url)
+    response.encoding = response.apparent_encoding
+    item_name_list = [] # 商品名を格納
+    pricenum_list = [] # 税抜き価格を格納
+    pricetax_list = [] # 税込価格を格納
+    # データフレームを定義
+    columns = ["商品名", "税抜き", "税込み"]
+    df = pd.DataFrame(columns=columns)
+    bs = BeautifulSoup(response.text, 'html.parser')
+    ～～～～～～(ここでHTML抽出の解析するscript記載)～～～～～～
+    # 各データをデータフレームに格納
-    se = pd.Series([item_name_list, pricenum_list, pricetax_list], columns)
+    se = pd.Series([item_name_list, price1_list, price2_list], columns)
     df = df.append(se, columns)
@@ -28,7 +72,7 @@
     # 収集したデータをエクセル形式で保存
-    filename = "check_list_%d.xlsx"%(suffix)
+    filename = "ckeck_list_%d.xlsx"%(suffix)
     df.to_excel(filename, encoding = 'utf-8-sig')
@@ -38,7 +82,7 @@
 # 処理したいURLのリスト
-urls = ["https://www.～～～", "https://www.～～～", "https://www.～～～"]
+urls = ["https://www～～～", "https://www～～～", "https://www～～～"]