回答率: 85.48%

質問するログイン新規登録

トップに関する質問 Pythonの計算速度アップ

編集履歴

質問編集履歴

2

追加

2017/08/30 17:47

投稿

スコア11

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -27,3 +27,37 @@
 式がややこしいですが、dates, sector_namesの要素ごとに、zcolumnが上位2割の数値を取り出して計算してafterdf2[wcolumn]というところに数値を返しています。
+【上記と似たコードですが追加で質問です】
+上記については、教えて頂いた通りにgroupby, transform, np.whereを組み合わせることで計算時間が数十分の１に改善しました。ありがとうございます。
+他のコードも同様に修正できたのですが、どうしても以下のコードが修正できません。上記のコードとほぼ一緒で、DATE, SECTORでgroupby()をするというところまでは同じだと思うのですが、zcolumnの上位20%の行のMKT_CAPという列の数字を操作するところが違い上手くいきません。
+```Python
+for (wcolumn, zcolumn) in zip(WM_columns, Z_columns):
+    afterdf2[wcolumn] = 0.0
+    for date1 in dates:
+        for name1 in sector_names:
+            z20sum = afterdf2[(afterdf2.DATE == date1) & (afterdf2.SECTOR == name1) &  (afterdf2[zcolumn] >= np.percentile(afterdf2[(afterdf2.DATE == date1) & (afterdf2.SECTOR == name1)].ix[:, zcolumn],80))].ix[:,'MKT_CAP'].sum()
+            afterdf2[wcolumn] = np.where((afterdf2.DATE == date1) & (afterdf2.SECTOR == name1) &    (afterdf2[zcolumn] >= np.percentile(afterdf2[(afterdf2.DATE == date1) & (afterdf2.SECTOR == name1)].ix[:, zcolumn],80)), afterdf2['MKT_CAP']    / z20sum * afterdf2['Sectorweight'] , afterdf2[wcolumn] )
+```
+教えて頂いたコードを参考に以下のように直してみたのですが、文法的に間違っているのか、TypeError: Transform function invalid for data typesというエラーになります。もし解決法がお分かりでしたら教えて頂けると大変助かります。よろしくお願いします。
+```Python
+afterdf2.groupby(['DATE','SECTOR'])[[zcolumn,'MKT_CAP']].transform(lambda d,m : np.where(d >= d.quantile(0.8), m / m[d >= d.quantile(0.8)].sum(), 0))
+```

1

書式を改善しました

2017/08/30 17:47

投稿

スコア11

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -5,6 +5,8 @@
 よろしくお願いします。
+```Python
 for (wcolumn, zcolumn) in zip(W_columns, Z_columns):
@@ -20,4 +22,8 @@
+```
-#式がややこしいですが、dates, sector_namesの要素ごとに、zcolumnが上位2割の数値を取り出して計算してafterdf2[wcolumn]というところに数値を返しています。
+式がややこしいですが、dates, sector_namesの要素ごとに、zcolumnが上位2割の数値を取り出して計算してafterdf2[wcolumn]というところに数値を返しています。