Python 実行速度を高速化したいです！

Question

### Python 実行速度を高速化し、時間短縮したいです！
今の書き方では、何日待っても終わらないため、
もっと早く終わるように高速化（最適化）したいです！

【追記】
やっていることは、
①（AからN列・1から6362行）のcsvファイルを読み込む
②CからN列の値を用いて、【Cが〇以下かつDが○以下かつ・・・Nが○○以下】と条件を指定し、その条件を満たす行（データ）のみを抽出する
③抽出した行（データ）におけるA列の合計値を求める
（「〇以下」の〇の値を一つずつ変えて全通りの条件において、A列の合計値を求める）
④Aの合計値が23を超える場合のみ、その条件と値を出力する

### 発生している問題・エラーメッセージ
```
今の処理を高速化したいです！
```
### 該当のソースコード
```Python
import numpy
from numba import jit, prange

score = numpy.loadtxt('sample.csv', delimiter=',', encoding='utf_8')

@jit(nopython=True, parallel=True)
def hello():
    for c in prange(0, 11):
        for d in prange(0, 4):
            for e in prange(0, 4):
                for f in prange(0, 12):
                    for g in prange(0, 12):
                        for h in prange(0, 19):
                            for i in prange(0, 334):
                                for j in prange(0, 235):
                                    for k in prange(0, 552):
                                        for l in prange(0, 25):
                                            for m in prange(0, 32):
                                                for n in prange(0, 43):
                                                    score1 = score[(score[:, 2] <= c) & (score[:, 3] <= d) & (score[:, 4] <= e) & (score[:, 5] <= f) & (score[:, 6] <= g) & (score[:, 7] <= h) & (score[:, 8] <= i) & (score[:, 9] <= j) & (score[:, 10] <= k) & (score[:, 11] <= l) & (score[:, 12] <= m) & (score[:, 13] <= n)]
                                                    if numpy.sum(score1[:, 0]) > 23:
                                                        score2 = numpy.sum(score1[:, 0])
                                                        print(c, d, e, f, g, h, i, j, k, l, m, n, score2)
hello()
```
### 試したこと
Cythonを試しましたが、処理速度はnumbaの方が速かったです。
またpythonよりも実行速度が速いC++やGoやJavaで実現しようとしましたが、pythonのようなデータフレーム機能が見当たらなかったため実現できませんでした。

### 補足情報（FW/ツールのバージョンなど）
pythonでなくても今と同じ結果が得られるのであれば手段は問いません。pythonでの高速化もしくは他の言語での実現について、ご教授いただけると幸いです。何卒よろしくお願いいたします。

Accepted Answer

> Rayやmultiprocessing、concurrent.futuresなど並列処理は今回のソースコードへどのように適用すれば

Rayは便利そうですが、使ったことがないのでconcurrent.futuresで書きます。


超シンプルなサンプル
```Python3
import time
import numpy as np
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor

def something_func(value):
    ans = 0
    for i in range(len(value)):
        for j in range(10):
            ans = ans + np.power(value[i],j)
    return ans

def executor(values,bool_TPE,num_workers):
    
    timer = time.time()
    
    if bool_TPE:
        print("TPE","Workers:",num_workers,end=" ")
        with ThreadPoolExecutor(max_workers=num_workers) as tpe:
            ans = tpe.map(something_func, values)
    else:
        print("PPE","Workers:",num_workers,end=" ")
        with ProcessPoolExecutor(max_workers=num_workers) as ppe:
            ans = ppe.map(something_func, values)
        
    print( time.time() - timer ,"[sec]")
    return ans


VALUES = np.asarray((1,2,3,4,5,6,7,8,9,10))

ans = executor(VALUES,bool_TPE=True,num_workers=2)
ans = executor(VALUES,bool_TPE=True,num_workers=5)

ans = executor(VALUES,bool_TPE=False,num_workers=2)
ans = executor(VALUES,bool_TPE=False,num_workers=5)

```
TPEはスレッドを複数走らせてFor文を処理します。
PPEはプロセスを複数走らせてFor文を処理します。

バクっとしてますが、シンプルなものはTPE向けですし、複雑な処理はPPE向けです。
早くなると思ったらシングルスレッドが一番早かった！もよくある話ですし、
いろいろな並列処理をまぜこぜにすると次亜塩素酸ナトリウムに酸性の液体を混ぜるようなことになります。オーバーヘッドが大きすぎて遅くなるだけなのでやめた方がイイです。
num_workersはCPUの(論理)コア数に合わせてあげてください。task managerで確認できるはずです。
うまくいけばコア数の倍数分だけ早くなります。

hello()について
---

データがないので試せませんが、
1. def executor(values,bool_TPE,num_workers):のvaluesをけずって、
2. something_func(value)をhello()にして、
3. .map(something_func, values)を.map(hello)
にしたら行けると思います。

構文エラー系が出たら適当に直してください :)

Python 実行速度を高速化し、時間短縮したいです！

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

hello()について

関連した質問