概要
openpyxlで作成したエクセルファイルを開こうとすると、
「aaa.xlsxの一部の内容に問題が見つかりました。可能な限り内容を回復しますか?」
というエラーが表示されます。
こちらで「はい」を選択すればエクセルファイルを開くことができるのですが、データの欠損があります。
このエラーが出ないようにプログラムを記述したいと思っています。
プログラム概要
ソースコードは以下に示しますが、行っていることは非常に簡単です。
・エクセルのテンプレートファイルを開く
・URLを指定し、GoogleChromeで当該ページを開く
・Webページ内にあるテーブルのデータをデータフレームに取り込む
・指定されたページの数だけWebページを開き、データフレームを結合する
・指定されたページの読み込みが終わると、データフレームを既存のエクセルシートに出力する
python
1#エクセルブックを開く 2templetefile = 'templete-aaa.xlsx' 3wb = openpyxl.load_workbook(templetefile) 4 5#特定のセルにデータを書き込み 6ws1=wb["sheet1"] 7koumoku_cell=ws1["K11"] 8koumoku_cell.value=1 9 10#関数呼び出し 11func1(id,wb) 12 13#エクセルファイルの保存 14filename='aaa.xlsx' 15wb.save(filename) 16 17#Workbookをクローズする 18wb.close() 19
python
1def func1(id_list,wb): 2 dfall1 = pd.DataFrame() 3 4 for id in id_list: 5 6 #URLを設定 7 url1='https://***/view.php?id={}'.format(id) 8 9 #格納用のデータフレームを用意 10 df1 = pd.DataFrame() 11 12 #ページを開く 13 driver.get(url1) 14 15 #html取得 16 html1=driver.page_source 17 df1=pd.read_html(html1) 18 19 dfs1=df1[0][['a','b','c']].dropna() 20 21 dfall1 = pd.concat([dfall1,dfs1]) 22 23 # ブック、シートを開く 24 ws1 = wb["sheet2"] 25 26 # ワークシートへデータを書き込む 27 sheet_write(dfall1,1,1,ws1) 28 29 30def sheet_write(df,row_start,col_start,worksheet): 31 rows = dataframe_to_rows(df, index=False, header=True) # openpyxlのユーティリティを使用 32 for row_no, row in enumerate(rows, row_start): 33 for col_no, value in enumerate(row, col_start): 34 worksheet.cell(row=row_no, column=col_no, value=value) # 1セルづつ書込む
あなたの回答
tips
プレビュー