前提・実現したいこと
pythonで複数のURLからスクレイピングを作成中です。(情報の取得はできております)
エクセル出力で取得した情報を一括でダウンロードしたいのですが
1つのURLごとにエクセルがダウンロードされてしまう状況になっています。
該当のソースコード
python
1import requests 2import pandas as pd 3from google.colab import files 4from bs4 import BeautifulSoup 5 6def f1(url, suffix): 7 response = requests.get(url) 8 response.encoding = response.apparent_encoding 9 10 11 item_name_list = [] # 商品名を格納 12 pricenum_list = [] # 税抜き価格を格納 13 pricetax_list = [] # 税込価格を格納 14 15 # データフレームを定義 16 columns = ["商品名", "税抜き", "税込み"] 17 df = pd.DataFrame(columns=columns) 18 19 bs = BeautifulSoup(response.text, 'html.parser') 20 21 ~~~~~~(ここでHTML抽出の解析するscript記載)~~~~~~ 22 23 # 各データをデータフレームに格納 24 se = pd.Series([item_name_list, price1_list, price2_list], columns) 25 df = df.append(se, columns) 26 27 # 収集したデータをエクセル形式で保存 28 filename = "ckeck_list_%d.xlsx"%(suffix) 29 df.to_excel(filename, encoding = 'utf-8-sig') 30 files.download(filename) 31 32# 処理したいURLのリスト 33urls = ["https://www~~~", "https://www~~~", "https://www~~~"] 34 35for i, url in enumerate(urls): 36 print('%s'%(url)) 37 f1(url, i) 38 print('%s\n\n'%(url))
試したこと
色々と調べたのですがうまくいかず....
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
あなたの回答
tips
プレビュー