for分を避けるアルゴリズムが思いつきません　python

前提・実現したいこと

現在、データ処理のコードを書いています。
ただ、pythonなのでfor分の速度が遅いので、できればfor分を避けたいと思っていますが
どうしても思いつかずに下記のコードを書きました。
しかし、データ量が非常に大きく、処理に非常に多くの時間がかかってしまいます。

どなたか、より簡単で高速なアルゴリズムを教えてくれませんか。

尚、cf_histは20000行308列のデータです。

下記のコードの説明ですが
cf_Mは
ステップ１：for分jの計算
cf_histの中の1行目1,2,3,4,5,6,7列目の数字にそれぞれ
moment_lenの1,2,3,4,5,6,7番目の要素を掛け合わせ
次にcf_histの中の1行目8,9,10,11,12,13,14列目の数字にそれぞれ
moment_lenの1,2,3,4,5,6,7番目の要素を掛け合わせ
次にcf_histの中の1行目15,16,17,18,19,20,21列目の数字にそれぞれ
moment_lenの1,2,3,4,5,6,7番目の要素を掛け合わせ
次にcf_histの中の1行目22,23,24,25,26,27,28列目の数字にそれぞれ
moment_lenの1,2,3,4,5,6,7番目の要素を掛け合わせ
そして上記の全28個の数字の合計をリストに格納してやり、burden_hight[1]で割ります。
（上記の4回分の計算をj in range(4)で表現）

ステップ２：for分mの計算
次にステップ１でのcf_histの中の1行目29,30,31,32,33,34,35,36(ステップ１のcf_histの番号にプラス28した数字）に
ステップ１と同様にmoment_lenの1,2,3,4,5,6,7番目の要素を掛け合わせて、あとはステップ１と同じです。

ステップ３：for分kの計算
これを20000行(k:0~19999)繰り返してやります。

該当のソースコード

momnt_len = [0.0045, 0.0035, 0.02, 0, -0.02, -0.0035, -0.045] 
burden_hight = [0.01375,0.0175,0.02625,0.035,0.035,0.035,0.035,0.035,0.02625,0.0175,0.02375] 

cf_layer_M = []
for k in range(20000):
	print(k)
	for m in range(11):
		burdenhight = float(burden_hight[m])
		for j in range(4):
			cf_M = (cf_hist[0+7*j+28*m][k]* momnt_len[0] + cf_hist[1+7*j+28*m][k]* momnt_len[1] + cf_hist[2+7*j+28*m][k]* momnt_len[2] +\
			cf_hist[3+7*j+28*m][k]* momnt_len[3] + cf_hist[4+7*j+28*m][k]* momnt_len[4] + cf_hist[5+7*j+28*m][k]* momnt_len[5] +\
			cf_hist[6+7*j+28*m][k]* momnt_len[6]) / (burdenhight)
			lst1.append(cf_M)
		cf_layer_M.append(sum(lst1))

aokikenichi

2020/08/24 09:02

試そうと思いましたが cf_hist がないですね。

行動規範の内容に同意します

回答1件

雑ですが以下のように行列で演算すると多少は速度がアップするかと思われます。

Python
1import numpy as np
2
3momnt_len = [0.0045, 0.0035, 0.02, 0, -0.02, -0.0035, -0.045] 
4burden_hight = [0.01375,0.0175,0.02625,0.035,0.035,0.035,0.035,0.035,0.02625,0.0175,0.02375]
5
6# テストデータ。１行分
7cf_hist = np.arange(308).reshape((308,-1))
8
9
10#
11# ループで演算
12#
13cf_layer_M = []
14for k in range(1):
15    print(k)
16    for m in range(11):
17        burdenhight = float(burden_hight[m])
18        lst1 = []
19        for j in range(4):
20            cf_M = (cf_hist[0+7*j+28*m][k]* momnt_len[0] + cf_hist[1+7*j+28*m][k]* momnt_len[1] + cf_hist[2+7*j+28*m][k]* momnt_len[2] +\
21            cf_hist[3+7*j+28*m][k]* momnt_len[3] + cf_hist[4+7*j+28*m][k]* momnt_len[4] + cf_hist[5+7*j+28*m][k]* momnt_len[5] +\
22            cf_hist[6+7*j+28*m][k]* momnt_len[6]) / (burdenhight)
23            lst1.append(cf_M)
24        cf_layer_M.append(sum(lst1))
25
26    print(np.array(cf_layer_M))
27    #[ -217.96363636  -430.45714286  -459.77142857  -474.42857143
28    #  -604.02857143  -733.62857143  -863.22857143  -992.82857143
29    # -1496.57142857 -2504.05714286 -2036.08421053]
30
31
32#
33# 行列で演算
34#
35
36# 以下は最初に用意しておけばよい
37a_momnt_len = np.array(momnt_len * 44)
38a_burden_hight = np.array(burden_hight)
39ones = np.ones((28,1))
40
41for k in range(1):
42    cf = cf_hist.T[k]
43    cf = cf * a_momnt_len
44    cf = cf.reshape((11,28))
45    cf = np.dot(cf, ones)
46    cf = cf.T / a_burden_hight
47    print(cf[0])
48    #[ -217.96363636  -430.45714286  -459.77142857  -474.42857143
49    #  -604.02857143  -733.62857143  -863.22857143  -992.82857143
50    # -1496.57142857 -2504.05714286 -2036.08421053]