スクレイピングをする際に、urlを下記のように1~12まで変更して次々と読み込ませます。
python
1from bs4 import BeautifulSoup 2import requests 3import pandas as pd 4from pandas import Series,DataFrame 5import time 6import numpy as np 7 8list=range(1,13) 9A=pd.DataFrame() 10for i in list: 11 url = 'www.aaa'+str(i) 12 result = requests.get(url) 13 c = result.content 14 soup = BeautifulSoup(c,'lxml') 15 summary = soup.find('div',{'class':'contentsFrame1'}) 16 table = summary.find_all('table') 17#省略 18・ 19・ 20・ 21 A.to_csv('user/'f'{i}_.csv') #スクレイピングした結果をcsvファイルに書き出します。 22#ファイル 1_.csv,2_.csv,・・・,12_.csv
そこでこのファイル名をurlを読み込ませる際には
www.aaa1~www.aaa-12の12個のサイトのurlを読み込ませております。
www.aaa1とした時には読み込んだサイトを上記では1_.csv
という風になります。
後々のファイル等の操作する関係で桁数が異なると困りますので、1~9を読み込ませる際には先頭に0をつけて
01_.csvにしたいと思っています。
関数を定義して記入できないかと考えましたが、なかなかいい方法が思い浮かびません。
ご教示のほどよろしくお願いいたします。
importの記述が不完全なので、記述をお願いします。
それから
>そこでこのファイル名をurlを読み込ませる際には1~12で読み込ませているのですが、
ファイル名を読み込ませたいのですか?urlを読み込ませたいのですか?それとも両方ですか?
正しく記載しないと戸惑ってしまいます。明確に記述して下さい。
よろしくお願いします。
回答4件
あなたの回答
tips
プレビュー