PySparkで以下のような処理をできたらと思っています.
【処理内容】
タイムスタンプの列から文字列をとってきて,新しい列(dayとtime)に追加したいと考えています.
pythonとsparkがともに初心者のため,是非お教えいただければ幸甚です.
python
1//#import liblaries 2import pandas as pd 3import numpy as np 4 5month_f = 4 6month_l = 8 7time_f = 8 8time_l = 12 9//#大元のDataframe 10df = pd.DataFrame({ 'Number' : [1, 2, 3, 4, 5, 6, 7], 11 'TimeStamp' : ["20161206185800", "20161206185800", "20161206185800", "20161207185800", "20161208185800","20161208185800","20161209185800"]}) 12//#TimeStamp行を取ってくる 13tsArray = np.array(df.TimeStamp) 14 15//#dayとtimeに分ける 16dayArray = [] 17timeArray = [] 18for i in tsArray: 19 dayArray.append(i[month_f:month_l]) 20 timeArray.append(i[time_f:time_l]) 21//#大元に追加 22df["day"] = dayArray 23df["time"] = timeArray
よろしくお願いいたします.

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/07/01 23:19