回答編集履歴

2023/03/29 07:34

投稿

スコア21118

test CHANGED Viewed

@@ -4,6 +4,7 @@
 from datetime import timedelta
 df = pd.read_csv('data.csv', parse_dates=['Time'])
+cols = df.columns
 # 1/13 0:00:00～1/15 23:55:00 と 2/13 0:00:00～2/15 23:55:00 のインデックス(5分毎)を作成
 first_day, last_day = df['Time'].min().date(), df['Time'].max().date() + timedelta(days=1)
@@ -11,14 +12,13 @@
 time_idx = time_idx.union(pd.date_range('2023-02-15', last_day, freq='5min', inclusive='left'))
 # reset datetime index
-dfx = df.set_index('Time').reindex(time_idx).rename_axis('Time').reset_index()
+dfx = df.set_index('Time').reindex(time_idx).rename_axis('Time').reset_index()[cols]
 # fullfill NaN
 dfx['A'] = dfx['A'].fillna('A').map('"{}"'.format)
 dfx['num'] = dfx['num'].fillna(0, downcast='infer')
 # save to CSV file
-dfx = dfx[['A', 'Time', 'num']]
 dfx.to_csv('filled_data.csv', index=False, quoting=3)
 ```

2023/03/29 07:23

投稿

melian

スコア21118

test CHANGED Viewed

@@ -1,35 +1,24 @@
-Pandas を使う場合。
+> 1/13の0:00:00～1/15の23:55:00・2/13の0:00:00～2/15の23:55:00と、この期間内であれば全ての時間帯での5分おきのデータを作成したい
 ```python
 import pandas as pd
+from datetime import timedelta
 df = pd.read_csv('data.csv', parse_dates=['Time'])
+# 1/13 0:00:00～1/15 23:55:00 と 2/13 0:00:00～2/15 23:55:00 のインデックス(5分毎)を作成
-dfx = df.set_index('Time').resample('5min').last().iloc[::-1].reset_index()
+first_day, last_day = df['Time'].min().date(), df['Time'].max().date() + timedelta(days=1)
-dfx = dfx.query('Time < "2023-01-16" or Time >= "2023-02-13"')
+time_idx = pd.date_range(first_day, '2023-01-16', freq='5min', inclusive='left')
+time_idx = time_idx.union(pd.date_range('2023-02-15', last_day, freq='5min', inclusive='left'))
+# reset datetime index
+dfx = df.set_index('Time').reindex(time_idx).rename_axis('Time').reset_index()
+# fullfill NaN
-dfx['A'] = dfx['A'].ffill().map('"{}"'.format)
+dfx['A'] = dfx['A'].fillna('A').map('"{}"'.format)
 dfx['num'] = dfx['num'].fillna(0, downcast='infer')
+# save to CSV file
 dfx = dfx[['A', 'Time', 'num']]
 dfx.to_csv('filled_data.csv', index=False, quoting=3)
 ```
-**filled_data.csv**
-```csv
-A,Time,num
-"A",2023-02-15 23:55:00,1
-"A",2023-02-15 23:50:00,2
-"A",2023-02-15 23:45:00,0
-"A",2023-02-15 23:40:00,3
-"A",2023-02-15 23:35:00,0
-"A",2023-02-15 23:30:00,2
-"A",2023-02-15 23:25:00,1
-"A",2023-02-15 23:20:00,0
-"A",2023-02-15 23:15:00,0
-"A",2023-02-15 23:10:00,1
-"A",2023-02-15 23:05:00,0
-"A",2023-02-15 23:00:00,4
-"A",2023-02-15 22:55:00,2
-"A",2023-02-15 22:50:00,0
-"A",2023-02-15 22:45:00,1
-```