１億以下の素数判定が遅い（区間篩 javaから書き換え）

#結論：JavaやCと比べるとPythonで外部ライブラリを使わずに高速化することは厳しい。
PythonはJavaやC ++に比べて非常に遅いのに、なぜ機械学習のような高速アルゴリズム処理にPythonが使われるのですか？

#追記
回答やコメントでご指摘くださった方ありがとうございました。

ここまでの回答やご指摘を取り込み修正した現状です。
修正後実行結果10^8
コードは長いのでGitHubへ

実用的かどうかは別ですが、まだ改善の余地があるのではないかと試行錯誤しておりますので引き続きヒントや気づいたことがあればご教示頂ければと思います。

素数判定に使われていると思われるアルゴリズム？が何なのか知りたい
以前頂いた回答からエラトステネスの篩を使った素数判定の実装は出来ました。

その後偶然見つけた記事から、エラトステネスの区間篩なるアルゴリズムを知り実装してみました。
元がjavaで書かれていたものをなるべくそのままpythonに書き換えたつもりなのですが旧来の篩のみに比べて倍近く遅くなりました。
そのままでは動かない部分を自分なりに改修したのが影響してるのかなと思います。

1億以下の正の整数を素数判定した実行速度比較
javaコード　：1秒未満
旧来の篩　　：11秒以上
今回の区間篩：24秒以上

####知りたいこと
書き換えでどこか間違っているのか
改善出来そうなことがあれば何かしらヒントやご教示頂けたら助かります。

import timeit

#旧：エラトステネスの篩
def eratosthenes_list(n):
    primes = [True] * n
    result = [2]
    for prime in range(3, n, 2):
        if primes[prime]:
            result.append(prime)
            for i in range(prime * prime, n, prime * 2):
                primes[i] = False
    return result

# 旧
nn = 100000000
print(timeit.timeit(lambda: (eratosthenes_list(nn)), number = 1))
# nn = 100000000
# 11.725847288999997

import timeit
import math

def primesSieve(n):
    sieve = [True] * n
    sieve[0] = sieve[1] = False
    for i in range(2, n):
        for j in range(i * 2, n, i):
            sieve[j] = False
    return sieve

#新：区間篩
def primesList(n):

        SIEVE_MAX = int(math.sqrt(n))
        primes = []
        sieve = primesSieve(SIEVE_MAX)

        for i in range(len(sieve)):
            if sieve[i]:
                primes.append(i)

        for i in range(1, int(n / SIEVE_MAX)):
            sieve = [True] * len(sieve)
            start_index = SIEVE_MAX * i

            for p in primes:
                if (p * p > start_index + SIEVE_MAX):
                    break

                jj = start_index + (p - (start_index % p)) % p
#                 print(jj, start_index + SIEVE_MAX, p)

                for j in range(jj, start_index + SIEVE_MAX, p):
                    sieve[j - start_index] = False

            for j in range(0, len(sieve)):
                if sieve[j]:
                    primes.append(start_index + j)
        return primes

# 新
nn = 100000000
print(timeit.timeit(lambda: (primesList(nn)), number = 1))
# print(timeit.timeit(lambda: print(primesList(nnn)), number = 1))
# nn = 100000000
# 24.349327380000002

行動規範の内容に同意します

回答5件

区間篩にした方はふるい落としを素数の2倍から始めているせいでは？

python
1# 旧篩
2for i in range(prime * prime, n, prime * 2)
3
4# 区間篩
5for j in range(i * 2, n, i)

おまけに区間篩の方では素数でない数をスキップしていませんから、余計に時間を食うと思います。

投稿2018/10/09 01:41

swordone

総合スコア20675

hayataka2049

2018/10/09 01:53

回答のコード書きながらプロファイル取ってましたが、そこはたかだかsqrt(n)までの篩なので、大勢に影響はなかったです。確かに改善点ですが