pythonを用いて、URLのリンクをExcelに出力するプログラムを作成しております。
リストとなるURLを追加でExcelに出力する際に、(Excelの最終行から、)前回のリストの続きとして追加できるプログラムを作成したいと考えております。
最終行を検出しURLリストの追加の方法をご教示いただきたいです。
よろしくお願いいたします
python
1from urllib import request 2from bs4 import BeautifulSoup 3import requests 4from urllib.parse import urljoin 5import openpyxl as op 6import datetime 7 8date1 = datetime.datetime.today() 9#print(date1) 10 11url = 'url' 12 13base_url = url 14html = request.urlopen(base_url) 15 16 17soup = BeautifulSoup(html,'html.parser') 18 19wb = op.load_workbook('スクレイピング.xlsx') 20ws = wb.active 21i = 1 22for a_tag in soup.find_all('a'): 23 j = (urljoin(base_url, a_tag.get('href'))) 24 if j.startswith('javascript'): 25 continue 26 #print(j) 27 ws['A'+str(i)].value = date1 28 ws['B'+str(i)].value = j 29 i += 1 30 31wb.save('スクレイピング.xlsx')
i = 1
の1を最終行に合わせ一回一回打ち込めばいいのですが、できればExcelを開かずにURLだけ変えてリストを次々に追加していけるようなものを作りたいと思っています。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/17 10:31
2018/07/17 10:46