前提・実現したいこと

初歩的な質問で大変恐縮なのですが、ご教示をお願い致します。

①Pythonで同フォルダ内にある複数のtextファイルを読込み
②一つのtextファイルに結合
③②について、textファイルとして出力をしたいです。

フォルダ名称：Pass
ファイル名：aaa_200701.txt、aaa_200702.txt … aaa_200712.txt

ただしそれぞれに同一のヘッダーがあります。
単純に結合する事は出来たのですが、2ファイル目以降を読み込む際、ヘッダーは読まないようにしたいです。

・aaa_200701.txtのデータ型
日付　商品　担当者　点数　金額
200701 a1 b1 c1 10 10000

・aaa_200702.txtのデータ型
日付　商品　担当者　点数　金額
200702 a1 b1 c1 8 8000
・
・
・

・【ALL】aaa.txt(※最終的に作りたいデータ)
日付　商品　担当者　点数　金額
200701 a1 b1 c1 10 10000
200702 a1 b1 c1 8 8000
・
・
・

この場合、どのようなコードを使用すれば良いでしょうか？

試したこと

■使用したコード

①②について

import glob, codecs

for file in glob.glob("Pass/aaa*.txt"):
file_data = open(file, "r",encoding="utf-8")
print(file_data.read())

file_data.close

→ただし2ファイル目以降のヘッダーも読んでしまうのでNG

③について

file=codecs.open(Pass/【ALL】aaa.txt', 'w'))

解決に向けた仮説

(A案)
・aaa_200701.txtは全て読む
・aaa_200702.txt～2行目以降を読む
・上記を【ALL】aaa.txt'として結合？

(B案)
・aaa_200701.txtの1行目のみ読む
・aaa_200701.txt～2行目以降を読む
・上記を【ALL】aaa.txt'として結合？

(C案)
・aaa_200701.txt～をaaa_200701.CSVに変換して読込？

y_shinoda

2020/07/10 17:18

「何を質問したいのか」を質問欄に追記おねがいします

行動規範の内容に同意します

回答5件

ベストアンサー

B案のほうが良いと思います。

余計な分岐が無いので処理が簡潔
ヘッダー行だけに何らかの操作を加えるような拡張に対して柔軟

例えば、こんなふうに。

Python
1with open('out.txt', mode='w') as fout:
2    files = glob.glob('aaa*.txt')
3    assert files
4    
5    # ヘッダーの出力
6    with open(files[0]) as fin:
7        header = next(fin)
8        fout.write(header)
9        
10    # データ行の出力
11    for file in files:
12        with open(file) as fin:
13            next(fin)   # ヘッダーのスキップ
14            fout.writelines(fin)

ヘッダーだけheader.txtから読んでくるとか、
ハードコーディングするとか、そのような変更をしたい場面も多々あるでしょう。

そのようなときもヘッダー行の書き込み処理だけをいじれば良いので簡単です。

本筋から逸れますが、
txtファイルではなくcsvファイルとして扱ったほうが後々扱いやすいかもしれません。

...よく見たら、C案がこれに相当するのですね。
ぶっちゃけ拡張子は半分ただの飾りなので、.txtのままCSV扱いもできます。
試したいことがあるなら気軽にトライできますよ。

もうちょっと複雑な処理が必要になるようであれば、テキストのまま扱うと面倒になってきます。

追記：私の頭の中にあるコード

Python
1with open('out.txt', mode='w') as fout:
2    files = glob.glob('aaa*.txt')
3    assert files
4    
5    # ヘッダーの出力
6    header = ['日付', '商品CD', '担当CD', '点数', '金額']
7    hdr2 = ','.join(header)
8    fout.write(hdr2)
9        
10    # データ行の出力
11    for file in files:
12        with open(file) as fin:
13            next(fin)   # ヘッダーのスキップ
14            fout.writelines(fin)

投稿2020/07/11 02:19

編集2020/07/18 23:56

LouiS0616

総合スコア35660

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！