前提・実現したいこと
次の画像のようなcsvファイルにおいて日付・時間に欠損があり、pandasを用いこれを補完しようと試みています。
該当のソースコード
python
1import pandas as pd 2 3df = pd.read_csv("ohtaki_2012.csv", 4 parse_dates={'datetime':['DATA','DAMU']}, 5 encoding='cp932') 6df.drop(df.columns[df.columns.str.contains('unnamed',case = False)],axis = 1, 7 inplace = True) 8df.head() 9 10 datetime 貯水量 貯水率 流入量 放流量 110 2012/1/1 1:00 21099.0 27.8 9.86 3.59 121 2012/1/1 2:00 21112.0 27.8 7.77 3.59 132 2012/1/1 3:00 21137.0 27.8 10.56 3.59 143 2012/1/1 4:00 21162.0 27.8 10.56 3.59 154 2012/1/1 5:00 21175.0 27.9 7.07 3.59 16 17 18df = pd.to_datetime(df['datetime'], infer_datetime_format=True) 19df = df.set_index("datetime") 20df = df.asfreq('1H') 21 22ParserError: hour must be in 0..23: 2012/1/1 24:00:00
発生している問題・エラーメッセージ
ParserError: hour must be in 0..23: 2012/1/1 24:00:00
エラーのメッセージ通り、元のcsvファイルにて時間が023時ではなく、124時と表記されてしまっており、これを修正する方法を探しています。
試したこと
単純に124時を023時に書き換えようとしましたが、その場合24:00が0:00に入れ替わることで時系列に矛盾が生じるため上手くいきませんでした。
補足情報(FW/ツールのバージョンなど)
GoogleColabを用いています。
データは国土交通省の水文水質データベースから取得しており、スクレイピングした後のデータを可能であればColab上の処理のみで処理したくて現状に至っております。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/05/23 13:59
2020/05/23 14:17
2020/05/23 14:21 編集
2020/05/23 17:08 編集