python3で DataFrame 内のdataで フォルダ内に日ごとのファイルがあります。
同じ重複した日時dataで一番上のdataを残し、
その他の重複dataを元データから消すと同時に 削除したいです。
取り除いた後、5秒ごとに足してdataを作成します。
<元データ>
DATE_TIME 人数
2016/8/8 0:00:00 100
2016/8/8 0:00:01 232
2016/8/8 0:00:02 336
2016/8/8 0:00:03 335
2016/8/8 0:00:03 132 ← この行は抽出・削除したいです。
2016/8/8 0:00:04 453
2016/8/8 0:00:05 223
: :
<出来上がり想定>
DATE_TIME 人数
2016/8/8 0:00:00 100
2016/8/8 0:00:01 232
2016/8/8 0:00:02 336
2016/8/8 0:00:03 335
2016/8/8 0:00:04 453
2016/8/8 0:00:05 223
: :
試したコード import glob import pandas as pd import numpy as np path = 'C:/filehokan/' file = 356 # フォルダ内のcsvファイル取得 csv_files = glob.glob(path + '*.csv', recursive=True) for i in range(file): df = pd.read_csv(csv_files[i], encoding = 'cp932', engine = 'python') df['DATE_TIME']=pd.to_datetime(df['DATE_TIME'],format='%Y-%m-%d %H:%M:%S') df.set_index('DATE_TIME', inplace=True) ********抽出・削除する処理がわかりません。dropnaを使用するのかわかりません。 df1 = df.resample('5s').sum ← 重複を取り除き、5秒ごとに足して新しく保存する df1.to_csv('C:/filehokan/newfile_df.csv', index = True, encoding = 'shift_jis') i += 1
宜しくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/11/25 05:24