質問編集履歴
17
ソースコード修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -16,7 +16,6 @@
|
|
|
16
16
|
```python
|
|
17
17
|
import numpy as np
|
|
18
18
|
import time as t
|
|
19
|
-
import sys
|
|
20
19
|
|
|
21
20
|
np.random.seed(0)
|
|
22
21
|
xyz = np.random.rand(4, 100000, 3)
|
16
ソースコード修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -14,6 +14,7 @@
|
|
|
14
14
|
大変お手数ですが、ご回答頂けると助かります。
|
|
15
15
|
|
|
16
16
|
```python
|
|
17
|
+
import numpy as np
|
|
17
18
|
import time as t
|
|
18
19
|
import sys
|
|
19
20
|
|
15
文章修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,5 +1,3 @@
|
|
|
1
|
-
※丸投げというご指摘があり、質問を大幅に見直しました。失礼いたしました。
|
|
2
|
-
|
|
3
1
|
**質問内容**
|
|
4
2
|
python3で作成した内積を計算するプログラムの高速化を検討しております。
|
|
5
3
|
はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
|
14
タイトル修正
title
CHANGED
|
@@ -1,1 +1,1 @@
|
|
|
1
|
-
|
|
1
|
+
内積計算のコード高速化
|
body
CHANGED
|
File without changes
|
13
試したことを追記
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -6,15 +6,13 @@
|
|
|
6
6
|
|
|
7
7
|
下記に、ロジック修正前とロジック修正後のソースを示します。
|
|
8
8
|
|
|
9
|
-
ロジック修正により5倍ほど処理時間は速くなりましたが、
|
|
9
|
+
ロジック修正により5倍ほど処理時間は速くなりましたが、さらに速くしたいと考えております。
|
|
10
|
-
|
|
10
|
+
ロジック修正後では、特に以下のループの部分がボトルネックとなっております。
|
|
11
11
|
|
|
12
|
-
ロジック修正後では、以下のループの部分がボトルネックとなっております。
|
|
13
|
-
|
|
14
|
-
p0 = [p0[:, i, :] for i in range(100000)]
|
|
15
12
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
16
13
|
|
|
17
|
-
この部分を高速化することは可能でしょうか?
|
|
14
|
+
ここは内積を計算する部分です。この部分を高速化することは可能でしょうか?
|
|
15
|
+
なお、試しにCythonでやってみましたが、エラーが出力されました。Cythonではlamdaはサポートされていないかもしれません。
|
|
18
16
|
大変お手数ですが、ご回答頂けると助かります。
|
|
19
17
|
|
|
20
18
|
```python
|
12
文章修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,4 +1,4 @@
|
|
|
1
|
-
※丸投げというご指摘があり、質問を大幅に見直しました。
|
|
1
|
+
※丸投げというご指摘があり、質問を大幅に見直しました。失礼いたしました。
|
|
2
2
|
|
|
3
3
|
**質問内容**
|
|
4
4
|
python3で作成した内積を計算するプログラムの高速化を検討しております。
|
11
文章修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,7 +1,7 @@
|
|
|
1
|
-
※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございません
|
|
1
|
+
※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございません。
|
|
2
2
|
|
|
3
3
|
**質問内容**
|
|
4
|
-
|
|
4
|
+
python3で作成した内積を計算するプログラムの高速化を検討しております。
|
|
5
5
|
はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
|
|
6
6
|
|
|
7
7
|
下記に、ロジック修正前とロジック修正後のソースを示します。
|
|
@@ -9,16 +9,17 @@
|
|
|
9
9
|
ロジック修正により5倍ほど処理時間は速くなりましたが、
|
|
10
10
|
さらに速くしたいと考えております。
|
|
11
11
|
|
|
12
|
-
ロジック修正後では、
|
|
12
|
+
ロジック修正後では、以下のループの部分がボトルネックとなっております。
|
|
13
13
|
|
|
14
|
+
p0 = [p0[:, i, :] for i in range(100000)]
|
|
14
15
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
15
16
|
|
|
16
|
-
この部分
|
|
17
|
+
この部分を高速化することは可能でしょうか?
|
|
17
18
|
大変お手数ですが、ご回答頂けると助かります。
|
|
18
19
|
|
|
19
20
|
```python
|
|
20
|
-
import numpy as np
|
|
21
21
|
import time as t
|
|
22
|
+
import sys
|
|
22
23
|
|
|
23
24
|
np.random.seed(0)
|
|
24
25
|
xyz = np.random.rand(4, 100000, 3)
|
|
@@ -27,32 +28,43 @@
|
|
|
27
28
|
def main():
|
|
28
29
|
|
|
29
30
|
print('===== ロジック修正前 START =====')
|
|
31
|
+
|
|
30
32
|
start1 = t.time()
|
|
31
33
|
for i in range(100000):
|
|
34
|
+
|
|
32
35
|
x = np.array(xyz[:, i, 0])
|
|
33
36
|
y = np.array(xyz[:, i, 1])
|
|
34
37
|
z = np.array(xyz[:, i, 2])
|
|
38
|
+
|
|
35
39
|
cvec = vec[:, i]
|
|
40
|
+
|
|
36
41
|
p0 = np.array([x, y, z])
|
|
37
42
|
p_ref = np.array([x[0], y[0], z[0]])
|
|
38
43
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
|
|
44
|
+
|
|
39
45
|
dat0 = np.dot(cvec, d_vec)
|
|
46
|
+
|
|
40
47
|
print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
|
|
41
|
-
print('===== ロジック修正前 END =====')
|
|
48
|
+
print('===== ロジック修正前ソース END =====')
|
|
42
49
|
|
|
43
|
-
print('===== ロジック修正後 START =====')
|
|
50
|
+
print('===== ロジック修正後ソース START =====')
|
|
51
|
+
|
|
44
52
|
start2 = t.time()
|
|
53
|
+
|
|
45
54
|
x = np.array(xyz[:, :, 0])
|
|
46
55
|
y = np.array(xyz[:, :, 1])
|
|
47
56
|
z = np.array(xyz[:, :, 2])
|
|
57
|
+
|
|
48
58
|
cvec = vec[:, :]
|
|
59
|
+
|
|
49
60
|
p0 = np.array([x.T, y.T, z.T])
|
|
50
61
|
p0 = [p0[:, i, :] for i in range(100000)]
|
|
51
62
|
p_ref = np.array([x[0], y[0], z[0]])
|
|
52
63
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
|
|
53
64
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
65
|
+
|
|
54
66
|
print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
|
|
55
|
-
print('===== ロジック修正後 END =====')
|
|
67
|
+
print('===== ロジック修正後ソース END =====')
|
|
56
68
|
|
|
57
69
|
if __name__ == "__main__":
|
|
58
70
|
main()
|
10
文章修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -9,12 +9,11 @@
|
|
|
9
9
|
ロジック修正により5倍ほど処理時間は速くなりましたが、
|
|
10
10
|
さらに速くしたいと考えております。
|
|
11
11
|
|
|
12
|
-
ロジック修正後では、以下の
|
|
12
|
+
ロジック修正後では、特に以下の部分がボトルネックとなっております。
|
|
13
13
|
|
|
14
|
-
p0 = [p0[:, i, :] for i in range(100000)]
|
|
15
14
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
16
15
|
|
|
17
|
-
この部分を高速化することは可能でしょうか?
|
|
16
|
+
この部分等を高速化することは可能でしょうか?
|
|
18
17
|
大変お手数ですが、ご回答頂けると助かります。
|
|
19
18
|
|
|
20
19
|
```python
|
9
タイトル編集
title
CHANGED
|
@@ -1,1 +1,1 @@
|
|
|
1
|
-
|
|
1
|
+
このソースコードを高速化できますでしょうか?
|
body
CHANGED
|
File without changes
|
8
ソース微修正
title
CHANGED
|
@@ -1,1 +1,1 @@
|
|
|
1
|
-
python このソースコードを高速化できますでしょうか?
|
|
1
|
+
【python】 このソースコードを高速化できますでしょうか?
|
body
CHANGED
|
File without changes
|
7
ソース微調整
title
CHANGED
|
@@ -1,1 +1,1 @@
|
|
|
1
|
-
|
|
1
|
+
python このソースコードを高速化できますでしょうか?
|
body
CHANGED
|
@@ -1,7 +1,7 @@
|
|
|
1
1
|
※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございませんでした。
|
|
2
2
|
|
|
3
3
|
**質問内容**
|
|
4
|
-
|
|
4
|
+
pythonで作成した内積を計算するプログラムの高速化を検討しております。
|
|
5
5
|
はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
|
|
6
6
|
|
|
7
7
|
下記に、ロジック修正前とロジック修正後のソースを示します。
|
6
ソース微修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -39,9 +39,9 @@
|
|
|
39
39
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
|
|
40
40
|
dat0 = np.dot(cvec, d_vec)
|
|
41
41
|
print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
|
|
42
|
-
print('===== ロジック修正前
|
|
42
|
+
print('===== ロジック修正前 END =====')
|
|
43
43
|
|
|
44
|
-
print('===== ロジック修正後
|
|
44
|
+
print('===== ロジック修正後 START =====')
|
|
45
45
|
start2 = t.time()
|
|
46
46
|
x = np.array(xyz[:, :, 0])
|
|
47
47
|
y = np.array(xyz[:, :, 1])
|
|
@@ -53,7 +53,7 @@
|
|
|
53
53
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
|
|
54
54
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
55
55
|
print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
|
|
56
|
-
print('===== ロジック修正後
|
|
56
|
+
print('===== ロジック修正後 END =====')
|
|
57
57
|
|
|
58
58
|
if __name__ == "__main__":
|
|
59
59
|
main()
|
5
ソース微修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -28,41 +28,30 @@
|
|
|
28
28
|
def main():
|
|
29
29
|
|
|
30
30
|
print('===== ロジック修正前 START =====')
|
|
31
|
-
|
|
32
31
|
start1 = t.time()
|
|
33
32
|
for i in range(100000):
|
|
34
|
-
|
|
35
33
|
x = np.array(xyz[:, i, 0])
|
|
36
34
|
y = np.array(xyz[:, i, 1])
|
|
37
35
|
z = np.array(xyz[:, i, 2])
|
|
38
|
-
|
|
39
36
|
cvec = vec[:, i]
|
|
40
|
-
|
|
41
37
|
p0 = np.array([x, y, z])
|
|
42
38
|
p_ref = np.array([x[0], y[0], z[0]])
|
|
43
39
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
|
|
44
|
-
|
|
45
40
|
dat0 = np.dot(cvec, d_vec)
|
|
46
|
-
|
|
47
41
|
print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
|
|
48
42
|
print('===== ロジック修正前ソース END =====')
|
|
49
43
|
|
|
50
44
|
print('===== ロジック修正後ソース START =====')
|
|
51
|
-
|
|
52
45
|
start2 = t.time()
|
|
53
|
-
|
|
54
46
|
x = np.array(xyz[:, :, 0])
|
|
55
47
|
y = np.array(xyz[:, :, 1])
|
|
56
48
|
z = np.array(xyz[:, :, 2])
|
|
57
|
-
|
|
58
49
|
cvec = vec[:, :]
|
|
59
|
-
|
|
60
50
|
p0 = np.array([x.T, y.T, z.T])
|
|
61
51
|
p0 = [p0[:, i, :] for i in range(100000)]
|
|
62
52
|
p_ref = np.array([x[0], y[0], z[0]])
|
|
63
53
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
|
|
64
54
|
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
65
|
-
|
|
66
55
|
print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
|
|
67
56
|
print('===== ロジック修正後ソース END =====')
|
|
68
57
|
|
4
ソース微修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -18,6 +18,7 @@
|
|
|
18
18
|
大変お手数ですが、ご回答頂けると助かります。
|
|
19
19
|
|
|
20
20
|
```python
|
|
21
|
+
import numpy as np
|
|
21
22
|
import time as t
|
|
22
23
|
|
|
23
24
|
np.random.seed(0)
|
3
ソース微修正
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -19,7 +19,6 @@
|
|
|
19
19
|
|
|
20
20
|
```python
|
|
21
21
|
import time as t
|
|
22
|
-
import sys
|
|
23
22
|
|
|
24
23
|
np.random.seed(0)
|
|
25
24
|
xyz = np.random.rand(4, 100000, 3)
|
2
質問内容を大幅に変更
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,33 +1,37 @@
|
|
|
1
|
-
※質問に
|
|
1
|
+
※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございませんでした。
|
|
2
|
+
|
|
2
3
|
**質問内容**
|
|
3
|
-
python3で作成したプログラムの高速化を検討しております。
|
|
4
|
+
python3で作成した内積を計算するプログラムの高速化を検討しております。
|
|
4
|
-
|
|
5
|
+
はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
|
|
5
|
-
そのため、今回も同じようにロジックの修正およびCythonでの高速化を考えております。しかし、私の脳みそではなかなかロジックの修正案が浮かびません。ロジックの修正(もし可能ならCythonまで)についてご教授頂けると非常に助かります。
|
|
6
|
-
なおロジックは公開されている下記論文が元となっております。
|
|
7
|
-
サンプルプログラムは私の環境では現状0.6秒です。1万倍の高速とは言わず10倍でもうれしいです。
|
|
8
|
-
(自分で考えろって感じですが、時間が限られているので泣きの質問です)
|
|
9
6
|
|
|
10
|
-
**ロジックについて**
|
|
11
|
-
スラントレンジベクトルと標高小面の4隅の位置情報から標高小面のスラントレンジベクトルと直交する面への投影面積を算出するプログラムを作成しました。
|
|
12
|
-
下記
|
|
7
|
+
下記に、ロジック修正前とロジック修正後のソースを示します。
|
|
13
|
-
http://www.geo.uzh.ch/microsite/rsl-documents/research/publications/peer-reviewed-articles/201108-TGRS-Small-tcGamma-3809999360/201108-TGRS-Small-tcGamma.pdf
|
|
14
8
|
|
|
9
|
+
ロジック修正により5倍ほど処理時間は速くなりましたが、
|
|
10
|
+
さらに速くしたいと考えております。
|
|
11
|
+
|
|
12
|
+
ロジック修正後では、以下のループの部分がボトルネックとなっております。
|
|
13
|
+
|
|
14
|
+
p0 = [p0[:, i, :] for i in range(100000)]
|
|
15
|
+
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
16
|
+
|
|
17
|
+
この部分を高速化することは可能でしょうか?
|
|
18
|
+
大変お手数ですが、ご回答頂けると助かります。
|
|
19
|
+
|
|
15
20
|
```python
|
|
16
|
-
import numpy as np
|
|
17
21
|
import time as t
|
|
22
|
+
import sys
|
|
18
23
|
|
|
19
|
-
|
|
24
|
+
np.random.seed(0)
|
|
20
|
-
# Position information of four corners of elevation facets
|
|
21
|
-
xyz = np.random.rand(4,
|
|
25
|
+
xyz = np.random.rand(4, 100000, 3)
|
|
22
|
-
# slant range vectors
|
|
23
|
-
vec = np.random.rand(3,
|
|
26
|
+
vec = np.random.rand(3, 100000)
|
|
24
27
|
|
|
25
|
-
area = np.zeros(xyz.shape[1])
|
|
26
|
-
|
|
27
28
|
def main():
|
|
28
29
|
|
|
29
|
-
|
|
30
|
+
print('===== ロジック修正前 START =====')
|
|
30
31
|
|
|
32
|
+
start1 = t.time()
|
|
33
|
+
for i in range(100000):
|
|
34
|
+
|
|
31
35
|
x = np.array(xyz[:, i, 0])
|
|
32
36
|
y = np.array(xyz[:, i, 1])
|
|
33
37
|
z = np.array(xyz[:, i, 2])
|
|
@@ -39,39 +43,29 @@
|
|
|
39
43
|
d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
|
|
40
44
|
|
|
41
45
|
dat0 = np.dot(cvec, d_vec)
|
|
42
|
-
dat1 = np.repeat(dat0, 3).reshape(4, 3).T
|
|
43
|
-
cvec2 = np.dot(cvec, cvec)
|
|
44
46
|
|
|
45
|
-
|
|
47
|
+
print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
|
|
46
|
-
|
|
48
|
+
print('===== ロジック修正前ソース END =====')
|
|
47
|
-
p1 = p0 - dat1 * m_cvec
|
|
48
49
|
|
|
49
|
-
# triangle P1
|
|
50
|
-
d00_01 = p1[:, 0] - p1[:, 1]
|
|
51
|
-
|
|
50
|
+
print('===== ロジック修正後ソース START =====')
|
|
52
|
-
d10_01 = p1[:, 2] - p1[:, 1]
|
|
53
51
|
|
|
54
|
-
|
|
52
|
+
start2 = t.time()
|
|
55
|
-
p00_10 = np.sqrt(np.dot(d00_10, d00_10)) # distance
|
|
56
|
-
p10_01 = np.sqrt(np.dot(d10_01, d10_01)) # distance
|
|
57
53
|
|
|
58
|
-
|
|
54
|
+
x = np.array(xyz[:, :, 0])
|
|
55
|
+
y = np.array(xyz[:, :, 1])
|
|
56
|
+
z = np.array(xyz[:, :, 2])
|
|
59
57
|
|
|
60
|
-
# triangle P2
|
|
61
|
-
|
|
58
|
+
cvec = vec[:, :]
|
|
62
|
-
d11_10 = p1[:, 3] - p1[:, 2]
|
|
63
59
|
|
|
60
|
+
p0 = np.array([x.T, y.T, z.T])
|
|
61
|
+
p0 = [p0[:, i, :] for i in range(100000)]
|
|
64
|
-
|
|
62
|
+
p_ref = np.array([x[0], y[0], z[0]])
|
|
65
|
-
|
|
63
|
+
d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
|
|
64
|
+
dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
|
|
66
65
|
|
|
67
|
-
|
|
66
|
+
print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
|
|
67
|
+
print('===== ロジック修正後ソース END =====')
|
|
68
68
|
|
|
69
|
-
a_p1 = np.sqrt(h1 * (h1 - p00_01) * (h1 - p00_10) * (h1 - p10_01))
|
|
70
|
-
a_p2 = np.sqrt(h2 * (h2 - p11_01) * (h2 - p11_10) * (h2 - p10_01))
|
|
71
|
-
area[i] = a_p1 + a_p2
|
|
72
|
-
|
|
73
|
-
print('time : ' + str(round((t.time() - start),3)) + ' [sec]')
|
|
74
|
-
|
|
75
69
|
if __name__ == "__main__":
|
|
76
70
|
main()
|
|
77
71
|
```
|
1
コメント追加
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,3 +1,4 @@
|
|
|
1
|
+
※質問に不備があるため編集予定です。
|
|
1
2
|
**質問内容**
|
|
2
3
|
python3で作成したプログラムの高速化を検討しております。
|
|
3
4
|
別途作成したプログラムにてロジックの修正およびCythonの実装で爆速(1万倍高速)したのを経験いたしました。
|