質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

6071閲覧

エクセルファイル名をデータに加えて連結したい。

Pfele

総合スコア17

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/12/24 15:56

編集2018/12/24 16:06

前提・実現したいこと

データ加工の自動化をPythonで行いたいと考え学び始めました。
複数の日付名のエクセルファイル(1201.xlsxなど)からファイル名の日付を読み込み、

1201.xlsx

abc
11121
21222
31323

エクセルの列に加えて、
|a|b|c|DATE|
|:--|:--:|--:|
|1|11|21|1201|
|2|12|22|1201|
|3|13|23|1201|

それらのファイルを連結したいと考えてます。
|a|b|c|DATE|
|:--|:--:|--:|
|1|11|21|1201|
|2|12|22|1201|
|3|13|23|1201|
|1|21|31|1203|
|2|22|32|1203|
|3|23|33|1203|

発生している問題・エラーメッセージ

ファイルの連結は何とかできたのですが、ファイル名を読み込んでエクセルの列に加えるfor文?が上手くいきません。 今のところ1つ1つファイルにファイル名(日付)を加えていくことしかできず、ファイル名を読み込むことが活かせていません。 何卒、超初心者に御教授下さいますようお願いいたします。

該当のソースコード

Python

1 2#ファイル名だけ読み込む 3import os.path 4 5filename = "1201.xlsx" 6name,ext = os.path.splitext(filename) 7 8 9#ファイル(1201.xlsx)に1201を加える 10import pandas as pd 11 12book=openpyxl.load_workbook("1201.xlsx") 13sheet=book.active 14 15for i in range(1,book["Sheet1"].max_row): 16 some="D"+str(i+1) 17 sheet[some]="1201" 18 i+=1 19book.save("1201.xlsx") 20 21 22#エクセルファイルを連結する 23import pandas as pd 24import glob 25 26excel_files = glob.glob("*.xlsx") 27list = [] 28 29for f in excel_files: 30 list.append(pd.read_excel(f)) 31df = pd.concat(list,sort = True) 32df.to_excel("ALL.xlsx")

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

以下のような感じでできます。
対象.xlsx元ファイルにファイル名列を追加するのは少々無駄なので、読込後のdfに対して追加しています。
元ファイルに列を追加するには、ソースコード中の処理①をコメントアウトし、処理②を生かしてください。

あと、変数名にlistのような予約語を使ってはいけません(使えるんだけど)。
その予約語が持つ動作をしなくなってしまいます。
例えば集合をリストに変換するx = list({1,2,3})のようなコードが動かなくなってしまいます。
以下コードではlstに書き換えています。

Python

1import glob 2import os.path 3import pandas as pd 4import openpyxl 5 6# エクセルファイルにファイル名列を追加する 7def add_name(path,name): 8 book=openpyxl.load_workbook(path) 9 sheet=book.active 10 for i in range(sheet.max_row): 11 some="D"+str(i+1) # D列固定 12 sheet[some]=name 13 book.save(path) 14 15 16#エクセルファイルを連結する 17excel_files = glob.glob("*.xlsx") 18lst= [] 19for f in excel_files: 20 name,ext = os.path.splitext(f) 21 22 if name == 'ALL': # 繰り返し実行対策 23 continue 24 25 #add_name(f,name) # 処理② ファイル名列を追加する 26 df = pd.read_excel(f,header=None) 27 df[2] = name # 処理① 位置はD列(=2)固定 28 lst.append(df) 29df = pd.concat(lst,sort = True) 30df.to_excel("ALL.xlsx",header=None,index=False)

投稿2018/12/25 00:40

編集2018/12/25 14:16
can110

総合スコア38233

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Pfele

2018/12/25 12:05

can110 様 回答ありがとうございます。 いろいろ試行錯誤しましたが、解決できず危うく挫折するところでした。 自分はやっぱり基礎的な事が解っていないと痛感しました。 本当にどうもありがとうございました。
Pfele

2018/12/26 11:28

can110 様 補足までありがとうございます。 これからは予約語まで気を付けます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問