質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

1650閲覧

フォルダを跨いだエクセルファイルのデータ統合に関して

n_sk

総合スコア1

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/04/23 05:51

編集2021/04/23 07:51

前提・実現したいこと

pythonで下記を実現したいです。
2つのフォルダに拡張子.xlsmの複数ファイルが入っており、
そのファイル群のデータを1つにまとめて、既存エクセルファイル(マクロ入り)のSheetへ吐き出したいです。

#環境
Windows10

#ディレクトリの状態
「売上」フォルダ

|_「2020」フォルダ__「詳細」フォルダ_複数の.xlsm
|          |_年間.xlsx

|_「2021」フォルダ__「詳細」フォルダ_複数の.xlsm
|_年間.xlsx

サイトにUPすると表示がズレますが、売上フォルダ直下ではなく、2021フォルダの下に年間.xlsxがあります。

発生している問題・エラーメッセージ

ValueError: File is not a recognized excel file

訳:ファイルが認識された Excel ファイルではありません

list.append(pd.read_excel(file)) 
⇒ここでエラーが発生します。 
上記部分を無視して次のコードを打てば、その後はエラーなく最後までコードが走り、既存ファイルへデータが上書きされるのですが、
「2020」下のxlsmは取得出来ていて「2021」下のxlsmは取得出来ていない、未完成なデータが抽出されてしまいます。

該当のソースコード

import pandas as pd import openpyxl as op import pathlib import glob folder = "\\共有ネットワークフォルダ\売上" files = glob.glob(folder + "\20**\*\*.xlsm", recursive=True) list = [] for file in files: list.append(pd.read_excel(file)) df = pd.concat(list) df["売上日"] = pd.to_datetime(df["売上日"]).dt.strftime("%Y年%m月") wb_name = pathlib.WindowsPath("\\共有ネットワークフォルダ\まとめ.xlsm") with pd.ExcelWriter(wb_name,mode="a") as writer: df.to_excel(writer, sheet_name="sheet1", index=None,columns=["売上日","型番","商品名","売上"]) wb = op.load_workbook(wb_name, keep_vba=True) wb.save(wb_name)

試したこと

files = glob.glob(folder + "\20****.xlsm", recursive=True)
⇒ print(files)で確認すると欲しいxlsmファイルは全て(2020のものも2021のものも)参照出来ています。

list.append(pd.read_excel(file))
⇒このコードの結果をprint(list)で確認すると2021下のxlsmデータが取得出来ていません。

取得出来ていないのが2021配下全てのファイルなので、
フォルダを跨ぐExcelデータ呼び出し時のコードに不備(前述のエラー「ファイルが認識された Excel ファイルではありません」)があるのだと判断し、append・pd.read_excelで出来る事の見直しをしましたが希望通り完成せず、この度質問させて頂きました。
ご教示宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

エクセル形式でないというメッセージが出ているのですから、そのファイルをエクセルで開いてみましょう。
どのファイルでエラーが出ているかは、以下の方法でわかります。

python

1for file in files: 2 print(f'{file} starts reading') 3 list.append(pd.read_excel(file)) 4 print(f'{file} ends reading')

エクセルで開けるようでしたら、名前を付けて保存で、上書きするとうまくいくかもしれません。

投稿2021/04/23 09:40

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

n_sk

2021/04/26 02:38 編集

返答が遅くなりすみません。 頂いたコードで確認したところ、2021のフォルダは相変わらず丸ごと取れていない事が判明し、さらに2020年のフォルダにも表示されていない謎のファイルがある様でした。 ただ、フォルダ内で隠しファイルの表示設定を変更しても、DWORD値の編集をしてもファイルが表示されない為、該当のファイルを探ってみます。 共有フォルダーなので、その部分が影響しているのかもしれません。 ともあれ、変なファイルが存在していそうなことは把握できましたので、自己解決できる様、頑張ってみたいと思います。 ご回答頂きありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問