気象庁の東京の気温のページの表をスクレイピングしてデータフレームにしたのですが、表に12/1が付与されていない為、pythonでそのままデータフレームにした後に日付型に変換すると1900年になってしまいます。このデータフレームの日付を2020-12-1 00:00のようにするにはどうすればよいでしょうか。
import numpy as np import pandas as pd from datetime import datetime url = 'http://www.data.jma.go.jp/obd/stats/etrn/view/10min_s1.php?prec_no=44&block_no=47662&year=2020&month=12&day=1&view=' data = pd.read_html(url) data[0].columns = ['時分','現地','海面','降水量(mm)','気温(℃)','相対湿度(%)','平均','風向','最大瞬間','風向','日照時間(分)'] df = data[0][['時分', '気温(℃)', '相対湿度(%)']] df = df.replace('24:00', '0:00') df.set_index('時分', inplace=True) df.index = pd.to_datetime(df.index, format='%H:%M') df
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/02 22:45