前提・実現したいこと
pythonで下記を実現したいです。
2つのフォルダに拡張子.xlsmの複数ファイルが入っており、
そのファイル群のデータを1つにまとめて、既存エクセルファイル(マクロ入り)のSheetへ吐き出したいです。
#環境
Windows10
#ディレクトリの状態
「売上」フォルダ
|
|_「2020」フォルダ__「詳細」フォルダ_複数の.xlsm
| |_年間.xlsx
|
|_「2021」フォルダ__「詳細」フォルダ_複数の.xlsm
|_年間.xlsx
サイトにUPすると表示がズレますが、売上フォルダ直下ではなく、2021フォルダの下に年間.xlsxがあります。
発生している問題・エラーメッセージ
ValueError: File is not a recognized excel file
訳:ファイルが認識された Excel ファイルではありません
list.append(pd.read_excel(file))
⇒ここでエラーが発生します。
上記部分を無視して次のコードを打てば、その後はエラーなく最後までコードが走り、既存ファイルへデータが上書きされるのですが、
「2020」下のxlsmは取得出来ていて「2021」下のxlsmは取得出来ていない、未完成なデータが抽出されてしまいます。
該当のソースコード
import pandas as pd import openpyxl as op import pathlib import glob folder = "\\共有ネットワークフォルダ\売上" files = glob.glob(folder + "\20**\*\*.xlsm", recursive=True) list = [] for file in files: list.append(pd.read_excel(file)) df = pd.concat(list) df["売上日"] = pd.to_datetime(df["売上日"]).dt.strftime("%Y年%m月") wb_name = pathlib.WindowsPath("\\共有ネットワークフォルダ\まとめ.xlsm") with pd.ExcelWriter(wb_name,mode="a") as writer: df.to_excel(writer, sheet_name="sheet1", index=None,columns=["売上日","型番","商品名","売上"]) wb = op.load_workbook(wb_name, keep_vba=True) wb.save(wb_name)
試したこと
files = glob.glob(folder + "\20****.xlsm", recursive=True)
⇒ print(files)で確認すると欲しいxlsmファイルは全て(2020のものも2021のものも)参照出来ています。
list.append(pd.read_excel(file))
⇒このコードの結果をprint(list)で確認すると2021下のxlsmデータが取得出来ていません。
取得出来ていないのが2021配下全てのファイルなので、
フォルダを跨ぐExcelデータ呼び出し時のコードに不備(前述のエラー「ファイルが認識された Excel ファイルではありません」)があるのだと判断し、append・pd.read_excelで出来る事の見直しをしましたが希望通り完成せず、この度質問させて頂きました。
ご教示宜しくお願い致します。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/04/26 02:38 編集