回答編集履歴

前日と前々日の比較も追加

2020/01/21 09:11

投稿

frodo821

スコア322

answer CHANGED Viewed

@@ -47,4 +47,46 @@
 df['signal'] = x
 ```
-こっちのほうが見た目明らかにすっきりしていますね。
+こっちのほうが見た目明らかにすっきりしていますね。
+-----
+前日と前々日の比較もするのでしたね。
+でしたら、このように変えてください。
+1行で書く場合
+```python
+df['signal'] = df['close'].rolling(3, min_periods=1).apply(lambda sr: 1 if sr[1:] and sr[1] > sr[0] and sr[2:] and sr[2] > sr[1] else 0, raw=True).apply(lambda x: 'True' if x else '-')
+```
+見やすくしてみたもの
+```python
+def aggregate(sr):
+  # `lambda sr: 1 if sr[1:] and sr[1] > sr[0] and sr[2:] and sr[2] > sr[1] else 0`に相当する関数
+  # データがあり、かつ先にあるデータのほうが値が小さい場合1を返し、それ以外なら0を返す。
+  if sr[1:] and sr[1] > sr[0] and sr[2:] and sr[2] > sr[1]:
+    return 1
+  return 0
+# 2行ずつデータを処理する。min_periods=1を指定しないと、最初の行が処理されない。
+rolling = df['close'].rolling(3, min_periods=1)
+# raw=Trueはpandas側の将来的な変更に対処するため。
+# なくても今は動くが、警告が出る。
+aggregated = df.apply(aggregate, raw=True)
+# aggregatedのそれぞれの値を'true'か'-'の文字列値に変えてdf['signal']に格納する。
+df['signal'] = aggregated.apply(lambda x: 'true' if x else '-')
+```
+forでやる方法
+```forでやる場合
+x = []
+for i, f in enumerate(df['close']):
+  if i == 0 or i == 1:
+    x.append('-')
+    continue
+  x.append('true' if f > df['close'].iloc[i-1] and df['close'].iloc[i-1] > df['close'].iloc[i-2] else '-')
+df['signal'] = x
+```

冗長な記述を削除

2020/01/21 09:11

投稿

frodo821

スコア322

answer CHANGED Viewed

@@ -23,7 +23,7 @@
 # なくても今は動くが、警告が出る。
 aggregated = df.apply(aggregate, raw=True)
-# aggregatedを'true'か'-'の文字列値に変えてdf['signal']に格納する。
+# aggregatedのそれぞれの値を'true'か'-'の文字列値に変えてdf['signal']に格納する。
 df['signal'] = aggregated.apply(lambda x: 'true' if x else '-')
 ```
@@ -44,7 +44,7 @@
     continue
   x.append('true' if f > df['close'].iloc[i-1] else '-')
-df['signal'] = pd.Series(x)
+df['signal'] = x
 ```
 こっちのほうが見た目明らかにすっきりしていますね。

詳しい解説を追加

2020/01/21 09:04

投稿

frodo821

スコア322

answer CHANGED Viewed

@@ -1,7 +1,50 @@
 すこし冗長ですが、こういうやり方もあります。
+```python
+df['signal'] = df['close'].rolling(2, min_periods=1).apply(lambda sr: 1 if sr[1:] and sr[1] > sr[0] else 0, raw=True).apply(lambda x: 'True' if x else '-')
 ```
+DataFrame.rollingやSeries.rollingは、複数の行または列にわたって集計するための関数です。
+これを少し見やすくして解説します。
+```python
+def aggregate(sr):
+  # `lambda sr: 1 if sr[1:] and sr[1] > sr[0] else 0`に相当する関数
+  # データがあり、かつ先にあるデータのほうが値が小さい場合1を返し、それ以外なら0を返す。
+  if sr[1:] and sr[1] > sr[0]:
+    return 1
+  return 0
+# 2行ずつデータを処理する。min_periods=1を指定しないと、最初の行が処理されない。
+rolling = df['close'].rolling(2, min_periods=1)
+# raw=Trueはpandas側の将来的な変更に対処するため。
+# なくても今は動くが、警告が出る。
+aggregated = df.apply(aggregate, raw=True)
+# aggregatedを'true'か'-'の文字列値に変えてdf['signal']に格納する。
-df['signal'] = df.rolling(2, min_periods=1).apply(lambda sr: 1 if sr[1:] and sr[1] > sr[0] else 0, raw=True).apply(lambda x: 'True' if x['close'] else '-', axis=1)
+df['signal'] = aggregated.apply(lambda x: 'true' if x else '-')
 ```
+見やすくして簡単にコメントをつけてみました。
+複数行の処理には`rolling`メソッドを使います。
+今回の場合、`'close'`行のみ集計に使うので、`df['close']`でこの行のみに処理を行っています。
-DataFrame.rollingは、複数の行または列にわたって集計するための関数です。
+また、処理を2段階に分けているのは、`rolling.apply`に数値以外を返す関数は渡すことができないからです。
+ここまでやるのであれば、おそらくfor文でやったほうがいいような気がします。
+一応その場合も書いておきます。
+```forでやる場合
+x = []
+for i, f in enumerate(df['close']):
+  if i == 0:
+    x.append('-')
+    continue
+  x.append('true' if f > df['close'].iloc[i-1] else '-')
+df['signal'] = pd.Series(x)
+```
+こっちのほうが見た目明らかにすっきりしていますね。

編集途中で送信してしまったため

2020/01/21 09:02

投稿

frodo821

スコア322

answer CHANGED Viewed

@@ -1,8 +1,7 @@
+すこし冗長ですが、こういうやり方もあります。
 ```
-def signal(df):
-    if df['close'].iloc[-1] > df['close'].iloc[-2]:
+df['signal'] = df.rolling(2, min_periods=1).apply(lambda sr: 1 if sr[1:] and sr[1] > sr[0] else 0, raw=True).apply(lambda x: 'True' if x['close'] else '-', axis=1)
-        return 'true'
-    else:
-        return '-'
-df['signal'] = df.apply(signal, axis=1)
-```
+```
+DataFrame.rollingは、複数の行または列にわたって集計するための関数です。