編集履歴

質問編集履歴

試したことの追加など

2021/10/18 00:31

投稿

obahaya

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,24 +1,20 @@
 ### Python 実行速度を高速化し、時間短縮したいです！
 今の書き方では、何日待っても終わらないため、
 もっと早く終わるように高速化（最適化）したいです！
 【追記】
 やっていることは、
 ①（AからN列・1から6362行）のcsvファイルを読み込む
-②CからN列の値を用いて、【Cが〇以下かつDが○以下かつ・・・Nが○○以下】と条件を指定し、その条件を満たすデータのみを抽出する
+②CからN列の値を用いて、【Cが〇以下かつDが○以下かつ・・・Nが○○以下】と条件を指定し、その条件を満たす行（データ）のみを抽出する
-③抽出したデータにおけるA列の合計値を求める
+③抽出した行（データ）におけるA列の合計値を求める
 （「〇以下」の〇の値を一つずつ変えて全通りの条件において、A列の合計値を求める）
 ④Aの合計値が23を超える場合のみ、その条件と値を出力する
 ### 発生している問題・エラーメッセージ
 ```
 今の処理を高速化したいです！
 ```
 ### 該当のソースコード
 ```Python
 import numpy
 from numba import jit, prange
@@ -45,11 +41,9 @@
                                                         print(c, d, e, f, g, h, i, j, k, l, m, n, score2)
 hello()
 ```
 ### 試したこと
+Cythonを試しましたが、処理速度はnumbaの方が速かったです。
+またpythonよりも実行速度が速いC++やGoやJavaで実現しようとしましたが、pythonのようなデータフレーム機能が見当たらなかったため実現できませんでした。
-pythonよりも実行速度が速いC++やGoやJavaで実現しようとしましたが、pythonのようなデータフレーム機能が見当たらなかったため実現できませんでした。
 ### 補足情報（FW/ツールのバージョンなど）
 pythonでなくても今と同じ結果が得られるのであれば手段は問いません。pythonでの高速化もしくは他の言語での実現について、ご教授いただけると幸いです。何卒よろしくお願いいたします。

7 517

タグを変更しました！

2021/10/18 00:31

投稿

obahaya

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

File without changes

7 517

ソースコードを変更しました。pandas→numbaに変更することで実行速度が速くなりました！

2021/10/14 21:41

投稿

obahaya

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -20,28 +20,30 @@
 ### 該当のソースコード
 ```Python
-import pandas as pd
-import numpy as np
+import numpy
-from pprint import pprint
+from numba import jit, prange
-df = pd.read_csv('sample.csv')
+score = numpy.loadtxt('sample.csv', delimiter=',', encoding='utf_8')
-for c in range(0, 11):
-    for d in range(0, 4):
-        for e in range(0, 4):
-            for f in range(0, 12):
-                for g in range(0, 12):
-                    for h in range(0, 19):
-                        for i in range(0, 334):
-                            for j in range(0, 235):
-                                for k in range(0, 552):
-                                    for l in range(0, 25):
-                                        for m in range(0, 32):
-                                            for n in range(0, 43):
-                                                dftemp = df.query('C <= @c and D <= @d and E <= @e and F <= @f and G <= @g and H <= @h and I <= @i and J <= @j and K <= @k and L <= @l and M <= @m and N <= @n')
-                                                if dftemp['A'].sum() > 23:
-                                                    ms = dftemp['A'].sum()
-                                                    print(c, d, e, f, g, h, i, j, k, l, m, n, ms)
+@jit(nopython=True, parallel=True)
+def hello():
+    for c in prange(0, 11):
+        for d in prange(0, 4):
+            for e in prange(0, 4):
+                for f in prange(0, 12):
+                    for g in prange(0, 12):
+                        for h in prange(0, 19):
+                            for i in prange(0, 334):
+                                for j in prange(0, 235):
+                                    for k in prange(0, 552):
+                                        for l in prange(0, 25):
+                                            for m in prange(0, 32):
+                                                for n in prange(0, 43):
+                                                    score1 = score[(score[:, 2] <= c) & (score[:, 3] <= d) & (score[:, 4] <= e) & (score[:, 5] <= f) & (score[:, 6] <= g) & (score[:, 7] <= h) & (score[:, 8] <= i) & (score[:, 9] <= j) & (score[:, 10] <= k) & (score[:, 11] <= l) & (score[:, 12] <= m) & (score[:, 13] <= n)]
+                                                    if numpy.sum(score1[:, 0]) > 23:
+                                                        score2 = numpy.sum(score1[:, 0])
+                                                        print(c, d, e, f, g, h, i, j, k, l, m, n, score2)
+hello()
 ```
 ### 試したこと

7 517

何をやっているか（何を求めたいか）を追加しました！

2021/10/12 00:26

投稿

obahaya

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -3,6 +3,14 @@
 今の書き方では、何日待っても終わらないため、
 もっと早く終わるように高速化（最適化）したいです！
+【追記】
+やっていることは、
+①（AからN列・1から6362行）のcsvファイルを読み込む
+②CからN列の値を用いて、【Cが〇以下かつDが○以下かつ・・・Nが○○以下】と条件を指定し、その条件を満たすデータのみを抽出する
+③抽出したデータにおけるA列の合計値を求める
+（「〇以下」の〇の値を一つずつ変えて全通りの条件において、A列の合計値を求める）
+④Aの合計値が23を超える場合のみ、その条件と値を出力する
 ### 発生している問題・エラーメッセージ
 ```

7 517