前提・実現したいこと
別々になっている日付と時間の列を、”日時”として1つの列にまとめたい。
具体的には、元データである<DATE>と<TIME>の列を、pandasのdatetime64[ns]型にして"Datetime"列としてindexに変換したい。
該当のソースコード
import pandas as pd
import numpy as np
import datetime
df = pd.read_csv("EURUSD_M1_201001040000_201912312259.csv",sep="\t", names=("Date","Time","Open","High","Low","Close","Tickvol","Vol","Spred"), dtype={0:str, 1:str})
df['Datetime'] = pd.to_datetime(df['Date'] + ' ' + df['Time'])
df = df.set_index('Datetime')
del df["Date"]
del df["Time"]
補足情報(FW/ツールのバージョンなど)
元データの情報。
df.head()
<DATE>\t<TIME>\t<OPEN>\t<HIGH>\t<LOW>\t<CLOSE>\t<TICKVOL>\t<VOL>\t<SPREAD>
0 2010.01.04\t00:00:00\t1.43259\t1.43259\t1.4321...
1 2010.01.04\t00:01:00\t1.43227\t1.43242\t1.4322...
2 2010.01.04\t00:02:00\t1.43234\t1.43244\t1.4323...
3 2010.01.04\t00:03:00\t1.43236\t1.43237\t1.4323...
4 2010.01.04\t00:04:00\t1.43232\t1.43235\t1.4322...
df.shape
(3699839, 1)
Jupyter lab を使用しています。
回答2件
あなたの回答
tips
プレビュー