時系列データで、直前の値を参照して計算する方法

前提・実現したいこと

Python初心者です。
下記のようなデータがあったとして、cを用いてdを計算したいと考えております。
cは事前に与えられているもの、dが計算結果です。
各行のdは直前のdも参照して計算しています。
具体的には、c_iとd_iをインデックスiのデータとした場合、d_1 = max(min(sum(d_0, c_1*0.1), 1), 0.5)。
ただし、一番初めのレコードについてはdは1となる。

	c	d
0	1.35	1
1	-1.37	0.86
2	-1.12	0.75
3	1.67	0.92
4	0.92	1
5	-1.89	0.81
6	1.57	0.97
7	1.96	1
8	-0.14	0.99
9	-0.5	0.94

import numpy as np
import pandas as pd
df=pd.DataFrame({'c': [1.35,-1.37,-1.12,1.67,0.92,-1.89,1.57,1.96,-0.14,-0.5]})

試したこと

下記のコードをベースに何かしようと思ったのですが、直前のdの結果を用いる方法が全く見当がつかず、困っています。
アドバイスいただけると助かります。

shift().rolling(1).apply(lambda x: x)

補足情報

Python 3.7.7
Numpy 1.18.1
Pandas 1.0.3

行動規範の内容に同意します

回答2件

前の行の 'd' が確定しない限り、次の行の 'd' の計算ができないのですから、あまり難しい事を考えずに素直にループで実装すると良いのではないでしょうか。

Python
1import numpy as np
2import pandas as pd
3df = pd.DataFrame({'c': [1.35,-1.37,-1.12,1.67,0.92,-1.89,1.57,1.96,-0.14,-0.5]})
4df['d'] = 1
5for idx, row in df.iloc[1:].iterrows():
6    df.loc[idx, 'd'] = max(min(df.shift(1).loc[idx, 'd'] + row['c'] * 0.1, 1), 0.5)
7#      c      d
8#0  1.35  1.000
9#1 -1.37  0.863
10#2 -1.12  0.751
11#3  1.67  0.918
12#4  0.92  1.000
13#5 -1.89  0.811
14#6  1.57  0.968
15#7  1.96  1.000
16#8 -0.14  0.986
17#9 -0.50  0.936

投稿2020/05/27 11:27

magichan

総合スコア15898

poppop

2020/05/28 01:18

ありがとうございます！stackoverflowで似たような質問があったのですが、ループなしの明確な答えが出てなかったので、やはりループは避けられないのかもしれません。実際のデータは数百MBあるので処理速度が重要なのですが、上記を参考にさせていただき、まずはループの高速化を試してみたいと思います。 https://stackoverflow.com/questions/46421928/pandas-apply-but-access-previously-calculated-value/46423562#46423562

行動規範の内容に同意します

ベストアンサー

pandasのメソッドだけでカッコよくやるやり方が思いつきませんでした。

python
1import numpy as np
2import pandas as pd
3df=pd.DataFrame({'c': [1.35,-1.37,-1.12,1.67,0.92,-1.89,1.57,1.96,-0.14,-0.5]})
4df["d"]=1.0
5for i in range(1,len(df)):
6    df.iat[i,1]=max([min([sum([df.iat[i-1,1], df.iat[i,0]*0.1]), 1]), 0.5])
7print(df)
8
9      c      d
100  1.35  1.000
111 -1.37  0.863
122 -1.12  0.751
133  1.67  0.918
144  0.92  1.000
155 -1.89  0.811
166  1.57  0.968
177  1.96  1.000
188 -0.14  0.986
199 -0.50  0.936