回答編集履歴

繰り返し二乗法

2020/08/03 22:48

投稿

Penpen7

スコア698

answer CHANGED Viewed

@@ -6,6 +6,7 @@
 追記) 愚直に計算を行うのではなく、前処理で素因数分解を行うことで高速(マイクロ秒くらい)に解けることを確認しました。
 まずは、エラトステネスの篩で素数列挙を行い, 通常の整数では素数で順番に割り算してどこまで割れるか試していき、階乗ではルジャンドルの定理を使って、素因数分解を行います。
 指数の足し算を行ったあと、実際に掛け算を行って、有理数(powplus/powminus)を求めてやります。
+(なお、掛け算時に累乗を計算する必要がありますが、これは繰り返し二乗法を使って高速化します。)
 ここまでは整数同士の掛け算割り算なので誤差はありませんが、最後に割り算を行い小数に直します。
 (試作のためpythonですが, 流れさえわかれば, javaでも組めると思います。javaでも書こうと思いましたが、pythonで力尽きました)

pythonによるテスト

2020/08/03 22:48

投稿

Penpen7

スコア698

answer CHANGED Viewed

@@ -1,4 +1,116 @@
 >上記パスカルの三角形を利用したコードで1000000007で割った余りを利用して、二項分布を使い「確率pをn回試行した時にk回当たる確率」を求めるにはどうすれば良いでしょうか
 競技プログラミングで組み合わせを求めるときはオーバーフローを防ぐため余りを使うことはやりますが、確率で余りをつかうことはできないと思います。
-二項分布にはほかの分布で近似されることが知られています。正規分布(np>5 np(1-p)>5のとき) あるいはポアソン分布(nが大きくpが十分に小さい場合)で近似できるため、こころへんの性質をつかうといいのではないでしょうか。
+二項分布にはほかの分布で近似されることが知られています。正規分布(np>5 np(1-p)>5のとき) あるいはポアソン分布(nが大きくpが十分に小さい場合)で近似できるため、こころへんの性質をつかうといいのではないでしょうか。
+追記) 愚直に計算を行うのではなく、前処理で素因数分解を行うことで高速(マイクロ秒くらい)に解けることを確認しました。
+まずは、エラトステネスの篩で素数列挙を行い, 通常の整数では素数で順番に割り算してどこまで割れるか試していき、階乗ではルジャンドルの定理を使って、素因数分解を行います。
+指数の足し算を行ったあと、実際に掛け算を行って、有理数(powplus/powminus)を求めてやります。
+ここまでは整数同士の掛け算割り算なので誤差はありませんが、最後に割り算を行い小数に直します。
+(試作のためpythonですが, 流れさえわかれば, javaでも組めると思います。javaでも書こうと思いましたが、pythonで力尽きました)
+```python
+from decimal import *
+# 素数列挙(エラトステネスの篩)
+def eratosthenes(n):
+    primeNumbers = []
+    isprime = [True]*(n+1)
+    for i in range(2, n+1):
+        if(isprime[i]):
+            primeNumbers.append(i)
+            temp = i
+            while(temp <= n):
+                isprime[temp] = False
+                temp += i
+    return primeNumbers
+# n!を素因数分解(ルジャンドルの定理)
+def primeFactorizeKaijo(n, primeNumbers):
+    assert(n <= max_int)
+    res = {}
+    for i in primeNumbers:
+        if(i > n):
+            break
+        temp = i
+        restemp = 0
+        while(temp <= n):
+            restemp += int(n/temp)
+            temp *= i
+        res[i] = restemp
+    return res
+# nを素因数分解する
+def primeFactorize(n, primeNumbers):
+    assert(n <= max_int)
+    res = {}
+    temp = n
+    for i in primeNumbers:
+        if(i > temp):
+            break
+        while(temp % i == 0):
+            if(i in res):
+                res[i] += 1
+            else:
+                res[i] = 1
+            temp /= i
+    return res
+def calculatePowMul(ans, fact, power):
+    for k, v in fact.items():
+        ans[k] += v*power
+# nCk * p^k * q^{n-k}
+n = 10000
+k = 5000
+# p = [pの分子, pの分母]
+p = [1, 65535]
+max_int = max([n, k, p[0], p[1]])
+# 素因数分解
+primeNumbers  = eratosthenes(max_int)
+pbunbo_fact   = primeFactorize(p[1],      primeNumbers)
+pbunshi_fact  = primeFactorize(p[0],      primeNumbers)
+qbunshi_fact  = primeFactorize(p[1]-p[0], primeNumbers)
+nkaijo_fact   = primeFactorizeKaijo(n,    primeNumbers)
+kkaijo_fact   = primeFactorizeKaijo(k,    primeNumbers)
+nmkkaijo_fact = primeFactorizeKaijo(n-k,  primeNumbers)
+# 指数同士の足し算をおこない、掛け算する
+ans = [0]*(max_int+1)
+calculatePowMul(ans, pbunbo_fact,   -n)
+calculatePowMul(ans, pbunshi_fact,   k)
+calculatePowMul(ans, qbunshi_fact, n-k)
+calculatePowMul(ans, nkaijo_fact,    1)
+calculatePowMul(ans, kkaijo_fact,   -1)
+calculatePowMul(ans, nmkkaijo_fact, -1)
+# 指数の正負で分ける(0は入れない)
+plus  = {}
+minus = {}
+for i in primeNumbers:
+    if(ans[i] > 0):
+        plus[i] = ans[i]
+    if(ans[i] < 0):
+        minus[i] = abs(ans[i])
+# 実際に掛け算を行う(
+powplus = 1
+for i in plus:
+    powplus *= pow(i, plus[i])
+powminus = 1
+for i in minus:
+    powminus *= pow(i, minus[i])
+# 有効桁数を50桁とする
+getcontext().prec = 50
+# 実際に割って小数にする
+print(Decimal(powplus)/Decimal(powminus))
+```
+```text
+CPU times: user 3 µs, sys: 0 ns, total: 3 µs
+Wall time: 5.25 µs
+6.3420873578683450119531499686198773734249989811395E-21075
+```
+ほぼ無視できるような確率ですね。

修正

2020/08/03 22:32

投稿

Penpen7

スコア698

answer CHANGED Viewed

@@ -1,4 +1,4 @@
 >上記パスカルの三角形を利用したコードで1000000007で割った余りを利用して、二項分布を使い「確率pをn回試行した時にk回当たる確率」を求めるにはどうすれば良いでしょうか
 競技プログラミングで組み合わせを求めるときはオーバーフローを防ぐため余りを使うことはやりますが、確率で余りをつかうことはできないと思います。
-nが十分に大きい場合、正規分布(np>5 np(1-p)>5) あるいはポアソン分布(nが大きくpが十分に小さい場合)に近づくため、こころへんの性質をつかうといいのではないでしょうか。
+二項分布にはほかの分布で近似されることが知られています。正規分布(np>5 np(1-p)>5のとき) あるいはポアソン分布(nが大きくpが十分に小さい場合)で近似できるため、こころへんの性質をつかうといいのではないでしょうか。