やりたいこと
規則性のあるサイトのurlを変更してそれぞれのurlの表を読み込みたいと思っております。
たとえば、
url = 'https://www.sss'+str(i)+'ccc'+str(n)+'aaa'
というurlがあったとしたときに
iは1〜12まで
nは1〜12までの
数字がかわり、144のサイトに読み込み、
この各サイトの表を読み込むプログラムをpythonで書きたいと考えております。
そこで下記のように書きました。
python
1from bs4 import BeautifulSoup 2import requests 3import pandas as pd 4from pandas import Series,DataFrame 5Round=list(range(1,13)) 6Place=list(range(1,13)) 7for i in Round: 8 for n in Place: 9 url = 'https://www.sss'+str(i)+'ccc'+str(n)+'aaa' 10result = requests.get(url) 11c = result.content 12soup = BeautifulSoup(c,'lxml') 13summary = soup.find('div',{'class':'contentsFrame1_inner'}) 14table = summary.find_all('table')
上記では、すべてのfor文を終えた後に、urlを読み込むので、
最後の
url = 'https://www.sss12ccc12aaa
の表しかスクレイピングできていない状況です。
そこで、144のサイトの表を読み込み為のプログラムを書くにはどのように
for文の箇所を変更すればよろしいですか?
ご確認よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/08/01 23:17