質問するログイン新規登録

質問編集履歴

17

ソースコード修正

2019/05/05 15:33

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -16,7 +16,6 @@
16
16
  ```python
17
17
  import numpy as np
18
18
  import time as t
19
- import sys
20
19
 
21
20
  np.random.seed(0)
22
21
  xyz = np.random.rand(4, 100000, 3)

16

ソースコード修正

2019/05/05 15:32

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -14,6 +14,7 @@
14
14
  大変お手数ですが、ご回答頂けると助かります。
15
15
 
16
16
  ```python
17
+ import numpy as np
17
18
  import time as t
18
19
  import sys
19
20
 

15

文章修正

2019/05/05 15:30

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,3 @@
1
- ※丸投げというご指摘があり、質問を大幅に見直しました。失礼いたしました。
2
-
3
1
  **質問内容**
4
2
  python3で作成した内積を計算するプログラムの高速化を検討しております。
5
3
  はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。

14

タイトル修正

2019/04/26 01:57

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
@@ -1,1 +1,1 @@
1
- ソースコード高速化できますでしょうか?
1
+ 内積計算のコード高速化
body CHANGED
File without changes

13

試したことを追記

2019/04/26 01:56

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -6,15 +6,13 @@
6
6
 
7
7
  下記に、ロジック修正前とロジック修正後のソースを示します。
8
8
 
9
- ロジック修正により5倍ほど処理時間は速くなりましたが、
9
+ ロジック修正により5倍ほど処理時間は速くなりましたが、さらに速くしたいと考えております。
10
- さら速くしたい考えております。
10
+ ロジック修正後では、特以下のループの部分がボトルネックなっております。
11
11
 
12
- ロジック修正後では、以下のループの部分がボトルネックとなっております。
13
-
14
- p0 = [p0[:, i, :] for i in range(100000)]
15
12
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
16
13
 
17
- この部分を高速化することは可能でしょうか?
14
+ こは内積を計算する部分です。この部分を高速化することは可能でしょうか?
15
+ なお、試しにCythonでやってみましたが、エラーが出力されました。Cythonではlamdaはサポートされていないかもしれません。
18
16
  大変お手数ですが、ご回答頂けると助かります。
19
17
 
20
18
  ```python

12

文章修正

2019/04/26 01:49

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,4 +1,4 @@
1
- ※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございません
1
+ ※丸投げというご指摘があり、質問を大幅に見直しました。失礼たしした
2
2
 
3
3
  **質問内容**
4
4
  python3で作成した内積を計算するプログラムの高速化を検討しております。

11

文章修正

2019/04/25 08:45

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,7 +1,7 @@
1
- ※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございませんでした
1
+ ※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございません。
2
2
 
3
3
  **質問内容**
4
- pythonで作成した内積を計算するプログラムの高速化を検討しております。
4
+ python3で作成した内積を計算するプログラムの高速化を検討しております。
5
5
  はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
6
6
 
7
7
  下記に、ロジック修正前とロジック修正後のソースを示します。
@@ -9,16 +9,17 @@
9
9
  ロジック修正により5倍ほど処理時間は速くなりましたが、
10
10
  さらに速くしたいと考えております。
11
11
 
12
- ロジック修正後では、特に以下の部分がボトルネックとなっております。
12
+ ロジック修正後では、以下のループの部分がボトルネックとなっております。
13
13
 
14
+ p0 = [p0[:, i, :] for i in range(100000)]
14
15
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
15
16
 
16
- この部分を高速化することは可能でしょうか?
17
+ この部分を高速化することは可能でしょうか?
17
18
  大変お手数ですが、ご回答頂けると助かります。
18
19
 
19
20
  ```python
20
- import numpy as np
21
21
  import time as t
22
+ import sys
22
23
 
23
24
  np.random.seed(0)
24
25
  xyz = np.random.rand(4, 100000, 3)
@@ -27,32 +28,43 @@
27
28
  def main():
28
29
 
29
30
  print('===== ロジック修正前 START =====')
31
+
30
32
  start1 = t.time()
31
33
  for i in range(100000):
34
+
32
35
  x = np.array(xyz[:, i, 0])
33
36
  y = np.array(xyz[:, i, 1])
34
37
  z = np.array(xyz[:, i, 2])
38
+
35
39
  cvec = vec[:, i]
40
+
36
41
  p0 = np.array([x, y, z])
37
42
  p_ref = np.array([x[0], y[0], z[0]])
38
43
  d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
44
+
39
45
  dat0 = np.dot(cvec, d_vec)
46
+
40
47
  print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
41
- print('===== ロジック修正前 END =====')
48
+ print('===== ロジック修正前ソース END =====')
42
49
 
43
- print('===== ロジック修正後 START =====')
50
+ print('===== ロジック修正後ソース START =====')
51
+
44
52
  start2 = t.time()
53
+
45
54
  x = np.array(xyz[:, :, 0])
46
55
  y = np.array(xyz[:, :, 1])
47
56
  z = np.array(xyz[:, :, 2])
57
+
48
58
  cvec = vec[:, :]
59
+
49
60
  p0 = np.array([x.T, y.T, z.T])
50
61
  p0 = [p0[:, i, :] for i in range(100000)]
51
62
  p_ref = np.array([x[0], y[0], z[0]])
52
63
  d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
53
64
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
65
+
54
66
  print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
55
- print('===== ロジック修正後 END =====')
67
+ print('===== ロジック修正後ソース END =====')
56
68
 
57
69
  if __name__ == "__main__":
58
70
  main()

10

文章修正

2019/04/25 02:19

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -9,12 +9,11 @@
9
9
  ロジック修正により5倍ほど処理時間は速くなりましたが、
10
10
  さらに速くしたいと考えております。
11
11
 
12
- ロジック修正後では、以下のループの部分がボトルネックとなっております。
12
+ ロジック修正後では、特に以下の部分がボトルネックとなっております。
13
13
 
14
- p0 = [p0[:, i, :] for i in range(100000)]
15
14
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
16
15
 
17
- この部分を高速化することは可能でしょうか?
16
+ この部分を高速化することは可能でしょうか?
18
17
  大変お手数ですが、ご回答頂けると助かります。
19
18
 
20
19
  ```python

9

タイトル編集

2019/04/24 14:14

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
@@ -1,1 +1,1 @@
1
- 【python】 このソースコードを高速化できますでしょうか?
1
+ このソースコードを高速化できますでしょうか?
body CHANGED
File without changes

8

ソース微修正

2019/04/24 13:43

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
@@ -1,1 +1,1 @@
1
- python このソースコードを高速化できますでしょうか?
1
+ python このソースコードを高速化できますでしょうか?
body CHANGED
File without changes

7

ソース微調整

2019/04/24 13:26

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
@@ -1,1 +1,1 @@
1
- python3 高速化 ロジックの修正
1
+ python このソースコードを高速化できますでしょうか?
body CHANGED
@@ -1,7 +1,7 @@
1
1
  ※丸投げというご指摘があり、質問を大幅に見直しました。大変申し訳ございませんでした。
2
2
 
3
3
  **質問内容**
4
- python3で作成した内積を計算するプログラムの高速化を検討しております。
4
+ pythonで作成した内積を計算するプログラムの高速化を検討しております。
5
5
  はじめはfor文を使用しておりましたので、for文を使わないようにロジックをみなおしました。
6
6
 
7
7
  下記に、ロジック修正前とロジック修正後のソースを示します。

6

ソース微修正

2019/04/24 13:25

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -39,9 +39,9 @@
39
39
  d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
40
40
  dat0 = np.dot(cvec, d_vec)
41
41
  print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
42
- print('===== ロジック修正前ソース END =====')
42
+ print('===== ロジック修正前 END =====')
43
43
 
44
- print('===== ロジック修正後ソース START =====')
44
+ print('===== ロジック修正後 START =====')
45
45
  start2 = t.time()
46
46
  x = np.array(xyz[:, :, 0])
47
47
  y = np.array(xyz[:, :, 1])
@@ -53,7 +53,7 @@
53
53
  d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
54
54
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
55
55
  print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
56
- print('===== ロジック修正後ソース END =====')
56
+ print('===== ロジック修正後 END =====')
57
57
 
58
58
  if __name__ == "__main__":
59
59
  main()

5

ソース微修正

2019/04/24 13:22

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -28,41 +28,30 @@
28
28
  def main():
29
29
 
30
30
  print('===== ロジック修正前 START =====')
31
-
32
31
  start1 = t.time()
33
32
  for i in range(100000):
34
-
35
33
  x = np.array(xyz[:, i, 0])
36
34
  y = np.array(xyz[:, i, 1])
37
35
  z = np.array(xyz[:, i, 2])
38
-
39
36
  cvec = vec[:, i]
40
-
41
37
  p0 = np.array([x, y, z])
42
38
  p_ref = np.array([x[0], y[0], z[0]])
43
39
  d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
44
-
45
40
  dat0 = np.dot(cvec, d_vec)
46
-
47
41
  print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
48
42
  print('===== ロジック修正前ソース END =====')
49
43
 
50
44
  print('===== ロジック修正後ソース START =====')
51
-
52
45
  start2 = t.time()
53
-
54
46
  x = np.array(xyz[:, :, 0])
55
47
  y = np.array(xyz[:, :, 1])
56
48
  z = np.array(xyz[:, :, 2])
57
-
58
49
  cvec = vec[:, :]
59
-
60
50
  p0 = np.array([x.T, y.T, z.T])
61
51
  p0 = [p0[:, i, :] for i in range(100000)]
62
52
  p_ref = np.array([x[0], y[0], z[0]])
63
53
  d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
64
54
  dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
65
-
66
55
  print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
67
56
  print('===== ロジック修正後ソース END =====')
68
57
 

4

ソース微修正

2019/04/24 13:22

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -18,6 +18,7 @@
18
18
  大変お手数ですが、ご回答頂けると助かります。
19
19
 
20
20
  ```python
21
+ import numpy as np
21
22
  import time as t
22
23
 
23
24
  np.random.seed(0)

3

ソース微修正

2019/04/24 13:20

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -19,7 +19,6 @@
19
19
 
20
20
  ```python
21
21
  import time as t
22
- import sys
23
22
 
24
23
  np.random.seed(0)
25
24
  xyz = np.random.rand(4, 100000, 3)

2

質問内容を大幅に変更

2019/04/24 13:20

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,33 +1,37 @@
1
- ※質問に不備があるめ編集予定
1
+ 丸投げというご指摘があり、質問を大幅見直しまし。大変申し訳ございませんした
2
+
2
3
  **質問内容**
3
- python3で作成したプログラムの高速化を検討しております。
4
+ python3で作成した内積を計算するプログラムの高速化を検討しております。
4
- 別途作成したプログラムロジックの修正よびCythonの実装で爆速(1万倍高速)たのを経験いたしました。
5
+ はじめはfor文を使用ておりましので、for文を使わないようにロジックをみなおしました。
5
- そのため、今回も同じようにロジックの修正およびCythonでの高速化を考えております。しかし、私の脳みそではなかなかロジックの修正案が浮かびません。ロジックの修正(もし可能ならCythonまで)についてご教授頂けると非常に助かります。
6
- なおロジックは公開されている下記論文が元となっております。
7
- サンプルプログラムは私の環境では現状0.6秒です。1万倍の高速とは言わず10倍でもうれしいです。
8
- (自分で考えろって感じですが、時間が限られているので泣きの質問です)
9
6
 
10
- **ロジックについて**
11
- スラントレンジベクトルと標高小面の4隅の位置情報から標高小面のスラントレンジベクトルと直交する面への投影面積を算出するプログラムを作成しました。
12
- 下記論文のFig.6ある投影面積の算出プグラムになります。論文にあるロジックを使っております。
7
+ 下記にジック修正前とロジック修正後のソース示します。
13
- http://www.geo.uzh.ch/microsite/rsl-documents/research/publications/peer-reviewed-articles/201108-TGRS-Small-tcGamma-3809999360/201108-TGRS-Small-tcGamma.pdf
14
8
 
9
+ ロジック修正により5倍ほど処理時間は速くなりましたが、
10
+ さらに速くしたいと考えております。
11
+
12
+ ロジック修正後では、以下のループの部分がボトルネックとなっております。
13
+
14
+ p0 = [p0[:, i, :] for i in range(100000)]
15
+ dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
16
+
17
+ この部分を高速化することは可能でしょうか?
18
+ 大変お手数ですが、ご回答頂けると助かります。
19
+
15
20
  ```python
16
- import numpy as np
17
21
  import time as t
22
+ import sys
18
23
 
19
- start = t.time()
24
+ np.random.seed(0)
20
- # Position information of four corners of elevation facets
21
- xyz = np.random.rand(4, 10000, 3)
25
+ xyz = np.random.rand(4, 100000, 3)
22
- # slant range vectors
23
- vec = np.random.rand(3, 10000)
26
+ vec = np.random.rand(3, 100000)
24
27
 
25
- area = np.zeros(xyz.shape[1])
26
-
27
28
  def main():
28
29
 
29
- for i in range(xyz.shape[1]):
30
+ print('===== ロジック修正前 START =====')
30
31
 
32
+ start1 = t.time()
33
+ for i in range(100000):
34
+
31
35
  x = np.array(xyz[:, i, 0])
32
36
  y = np.array(xyz[:, i, 1])
33
37
  z = np.array(xyz[:, i, 2])
@@ -39,39 +43,29 @@
39
43
  d_vec = p0 - np.repeat(p_ref, 4).reshape(3, 4)
40
44
 
41
45
  dat0 = np.dot(cvec, d_vec)
42
- dat1 = np.repeat(dat0, 3).reshape(4, 3).T
43
- cvec2 = np.dot(cvec, cvec)
44
46
 
45
- n_cvec = cvec / cvec2
47
+ print('time : ' + str(round((t.time() - start1),5)) + ' [sec]')
46
- m_cvec = np.repeat(n_cvec, 4).reshape(3, 4)
48
+ print('===== ロジック修正前ソース END =====')
47
- p1 = p0 - dat1 * m_cvec
48
49
 
49
- # triangle P1
50
- d00_01 = p1[:, 0] - p1[:, 1]
51
- d00_10 = p1[:, 0] - p1[:, 2]
50
+ print('===== ロジック修正後ソース START =====')
52
- d10_01 = p1[:, 2] - p1[:, 1]
53
51
 
54
- p00_01 = np.sqrt(np.dot(d00_01, d00_01)) # distance
52
+ start2 = t.time()
55
- p00_10 = np.sqrt(np.dot(d00_10, d00_10)) # distance
56
- p10_01 = np.sqrt(np.dot(d10_01, d10_01)) # distance
57
53
 
58
- h1 = (p00_01 + p00_10 + p10_01) / 2 # semi-perimeter of the triangles P1
54
+ x = np.array(xyz[:, :, 0])
55
+ y = np.array(xyz[:, :, 1])
56
+ z = np.array(xyz[:, :, 2])
59
57
 
60
- # triangle P2
61
- d11_01 = p1[:, 3] - p1[:, 1]
58
+ cvec = vec[:, :]
62
- d11_10 = p1[:, 3] - p1[:, 2]
63
59
 
60
+ p0 = np.array([x.T, y.T, z.T])
61
+ p0 = [p0[:, i, :] for i in range(100000)]
64
- p11_01 = np.sqrt(np.dot(d11_01, d11_01)) # distance
62
+ p_ref = np.array([x[0], y[0], z[0]])
65
- p11_10 = np.sqrt(np.dot(d11_10, d11_10)) # distance
63
+ d_vec = p0 - np.repeat(p_ref, 4).reshape(100000, 3, 4)
64
+ dat0 = list(map(lambda x, y: np.dot(x, y), cvec.T, d_vec))
66
65
 
67
- h2 = (p11_01 + p11_10 + p10_01) / 2 # semi-perimeter of the triangles P1
66
+ print('time : ' + str(round((t.time() - start2),5)) + ' [sec]')
67
+ print('===== ロジック修正後ソース END =====')
68
68
 
69
- a_p1 = np.sqrt(h1 * (h1 - p00_01) * (h1 - p00_10) * (h1 - p10_01))
70
- a_p2 = np.sqrt(h2 * (h2 - p11_01) * (h2 - p11_10) * (h2 - p10_01))
71
- area[i] = a_p1 + a_p2
72
-
73
- print('time : ' + str(round((t.time() - start),3)) + ' [sec]')
74
-
75
69
  if __name__ == "__main__":
76
70
  main()
77
71
  ```

1

コメント追加

2019/04/24 09:00

投稿

dream-20xx
dream-20xx

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,3 +1,4 @@
1
+ ※質問に不備があるため編集予定です。
1
2
  **質問内容**
2
3
  python3で作成したプログラムの高速化を検討しております。
3
4
  別途作成したプログラムにてロジックの修正およびCythonの実装で爆速(1万倍高速)したのを経験いたしました。