質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

5回答

471閲覧

【Python】読み込んだ複数のCSVファイルを1つにまとめたい

beathacker

総合スコア14

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/12/20 03:35

Python初心者で大変恐縮ではございますが、複数のCSVファイルの扱い方で困っております。

以下に示すようなCSVファイルが複数あり(例として2つ示しています)、Pythonを使用して、時系列毎にカラム名が"logs"の列の値を足しこんだCSVファイルを書き出したいと思っております。

  • File1.csv - File2.csv

|dataTime |logs|   |dataTime |logs|
|2018/10/1 0:00:00|160|   |2018/10/1 0:00:00|120|
|2018/10/1 0:01:00|110|   |2018/10/1 0:01:00|100|
|2018/10/1 0:02:00|130|   |2018/10/1 0:02:00|120|



↓↓↓(logsの値をsumして以下のように書き出したいと思っております)

|dataTime |logs|
|2018/10/1 0:00:00|280|
|2018/10/1 0:01:00|210|
|2018/10/1 0:02:00|250|


ファイルが少なければ手作業でも出来るのですが、複数ある為、作業を簡略化したいと考えております。
初歩的な質問かもしれませんが、詳しい方、ご教授頂けますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答5

0

pandas を使わずに書いてみました。

python3

1import csv 2 3with open('file1.csv') as csvfile: 4 data = {row['dataTime']: int(row['logs']) for row in csv.DictReader(csvfile)} 5 6with open('file2.csv') as csvfile: 7 reader = csv.DictReader(csvfile) 8 for row in csv.DictReader(csvfile): 9 k = row['dataTime'] 10 v = int(row['logs']) 11 if data.get(k): 12 data[k] = 0 13 data[k] += v 14 15with open('file3.csv', 'w', newline='') as csvfile: 16 fieldnames = ['dataTime', 'logs'] 17 writer = csv.DictWriter(csvfile, fieldnames=fieldnames) 18 19 writer.writeheader() 20 for k in sorted(data.keys()): 21 writer.writerow({'dataTime': k, 'logs': data[k]})

実行例
イメージ説明

投稿2018/12/27 03:43

katoy

総合スコア22324

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

これで行けると思います。

Python

1import pandas as pd 2 3File1 = pd.read_csv("File1.csv", "|") 4File2 = pd.read_csv("File2.csv", "|") 5 6File = pd.concat([File1, File2]).groupby("dataTime")[["logs"]].sum() 7 8File.to_csv("File3.csv", "|")

投稿2018/12/20 05:30

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

beathacker

2018/12/22 07:41

お返答頂きありがとうございます。しっかりとsumする事が出来ました。本当にありがとうございます。
guest

0

dataframeに両方追加で読み込み、dataTimeカラムでgroupbyしてsumすれば良いかと。

投稿2018/12/20 05:27

t_obara

総合スコア5488

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

末尾だけ違うものをフォルダごと読み込む場合

Python

1import pandas as pd 2import glob 3import os 4 5path = r"C:\ディレクトリ" 6all_files = glob.glob(os.path.join(path, "File*.csv")) 7 8all_pd = (pd.read_csv(f) for f in all_files) 9File = pd.concat(all_pd, ignore_index=True) 10 11File.to_csv("File.csv")

投稿2018/12/20 04:48

編集2018/12/20 04:52
takayoukey

総合スコア21

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

Python

1import pandas as pd 2 3File1 = pd.read_csv("File1.csv") 4File2 = pd.read_csv("File2.csv") 5 6File = pd.concat([File1, File2]) 7 8File.to_csv("File.csv")

投稿2018/12/20 04:30

編集2018/12/20 04:52
takayoukey

総合スコア21

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問