回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップ MacOS(OSX)に関する質問

Q&A

2回答

692閲覧

平均処理時間が明らかに一致しない

総合スコア19

0グッド

0クリップ

投稿2021/06/01 03:12

編集2021/06/01 05:47

0

0

python
1import time
2import numpy as np
3
4NA ='ACGT'
5n = 100000
6s = ''
7N=10
8myBytes = {}
9for n in range(5000,100000,5000):
10    myBytes[n] = (s.join([random.choice(DNA) for i in range(n)])).encode()
11    for j in range(N):
12        st1_time = time.time() 
13        xR = makeSuffixArrayByInducedSorting(myBytes[n],256,0,False) 
14        et1_time = time.time()
15        lap1_time= et1_time-st1_time
16        np.mean(lap1_time)
17        
18        st2_time = time.time()
19        nR = naivelyBuildSA(myBytes[n])
20        et2_time = time.time()
21        lap2_time = et2_time-st2_time
22        np.mean(lap2_time)
23    print("processing time：{} {} {}".format(np.mean(lap1_time),np.mean(lap2_time), xR==nR))

このようなコードを作成して,n=5000から100000まで5000ずつで変化させた時のn=5000の時にxRとnRを計算してその時の10回の平均を結果としてlap1_timeとlap2_timeで答えとして出力し,その後n=10000について同様の処理を行うというプログラムを書いたつもりでした.
n=100000だけを10回の平均を取るなどせず求めると大体lap2は12秒かかるのに対してこのプログラムで出てきた結果は3秒で明らかにプログラムの動作自体が遅いのでこのような結果になるはずがないのですが,このプログラムが間違っているのでしょうか.lap1の方は大体単体と同じような結果が得られています.

python
1
2import time
3import numpy as np
4
5NA ='ACGT'
6n = 100000
7s = ''
8N=10
9myBytes = {}
10st0_time = time.time()
11for n in range(5000,100000,5000):
12    myBytes[n] = (s.join([random.choice(DNA) for i in range(n)])).encode()
13    lap1_time =0
14    lap2_time =0
15    for j in range(N):
16        st1_time = time.time() 
17        xR = makeSuffixArrayByInducedSorting(myBytes[n],256,0,False) 
18        et1_time = time.time()
19        lap1_time = et1_time-st1_time +lap1_time
20        st2_time = time.time()
21        nR = naivelyBuildSA(myBytes[n])
22        et2_time = time.time()
23        lap2_time= et2_time-st2_time + lap2_time
24    ave1=lap1_time/N
25    ave2=lap2_time/N
26    print("processing time：{} {} {}".format(ave1,ave2, xR==nR))
27print(time.time()-st0_time)

2021/06/01 03:30

入門からやり直してみてはいかがでしょうか。

2021/06/01 04:34 編集

lap1_time, lap2_timeどちらも、forループが回る毎回、単に上書きされてるだけです前回の結果は残ってませんので、ループが終わった状態では、最後に測った値が入ってるだけなので、平均はできません質問の時間が合わないのはなぜ？とは直接関係無いかもしれませんが、気になったので

2021/06/01 04:36

>>jbpb0さんコメントありがとうございます. np.meanが平均値をとるものだと認識して行っていて,meanを表示しているつもりなのですが,違いますか?

2021/06/01 04:43

ループの1回目で、 lap1_time= et1_time-st1_time で、「lap1_time」にその時(ループ1回目)に計算された時間が代入されますループの2回目で、 lap1_time= et1_time-st1_time で、「lap1_time」にその時(ループ2回目)に計算された時間が代入されますその時に、ループ1回目に「lap1_time」に代入された数値は消えます (上書き代入してるだけだから) ループ3回目以降も同様です毎回、 lap1_time= et1_time-st1_time で、「lap1_time」にその時に計算された時間が代入されて、その数値だけ残りますその結果、ループが終わった時に「lap1_time」に入ってる数値は、ループの最後の回に計算された時間だけです

2021/06/01 04:43

meanをループの外に出してみた(for jと同じ位置)にしてもうまくいきませんでした.

2021/06/01 04:45

lap1_time= et1_time-st1_time という上書き代入をしていて最後に計算した時間だけしか残らない、というところを直さない限り、何をしてもダメです

2021/06/01 04:57 編集

lap1_time= et1_time-st1_timeを lap1_time+=lap1_time のように定義してみたのですが,これは前回のが保存されて足されていくという式になっていますか?

2021/06/01 04:58

for j in range(N): のループで、(N=10の)10回の平均をしたいのですよね？そうならば、 [n]ではなくて[j]でしょうただし、ループ初回(j=0)の[j-1]=[-1]はダメなので、そこ回避しないといけないけど

2021/06/01 05:12 編集

というか、単に lap1_time= et1_time-st1_time+lap1_time でいいのではないですか？ただし、下記も要りますけど・ループに入る前に0を代入する・ループ終わった後にN(=10)で割る【追記】上記「ループ」とは、「for j in range(N):」のループのことです

2021/06/01 05:13 編集

あるいは、 lap1_time[j]= et1_time-st1_time として、ループ終わった後に平均する【追記】上記「ループ」とは、「for j in range(N):」のループのことです

2021/06/01 05:17

NA ='ACGT' は、 DNA ='ACGT' の誤りですか？他に誤りはありませんか？

2021/06/01 05:25

lap1_time =0 lap2_time =0 for j in range(N): st1_time = time.time() xR = makeSuffixArrayByInducedSorting(myBytes[n],256,0,False) et1_time = time.time() lap1_time = et1_time-st1_time+lap1_time st2_time = time.time() nR = naivelyBuildSA(myBytes[n]) et2_time = time.time() lap2_time = et2_time-st2_time+lap2_time ave1=lap1_time/N ave2=lap2_time/N print("processing time：{} {} {}".format(ave1,ave2, xR==nR)) このように変えてみました.

2021/06/01 05:26

インデントがないように見えますが,aveとprintはforの外においています.

2021/06/01 05:29

DNAでプログラムは作成できています.コピペのミスです.申し訳ございません.

2021/06/01 05:30

上のように変えてみましたが,やはり中身としては変わっていなさそうです.

2021/06/01 05:32

> インデントがないように見えますが,aveとprintはforの外においています. はい print(... で、10回平均の時間(ave1, ave2)が表示されると思いますそれが、「for n in range(5000,100000,5000):」のループで毎回起きます (一つのnに対して1回) それで意図通りですよね？

2021/06/01 05:35

意図はnを5000から100000まで変化させる中で一つのnに対して10回計算を行い,それの平均を求めるということです. ただ結果は前回同様単体での結果と大きく離れてしまっています.

2021/06/01 05:35

なので意図としてはjbpb0さんの意図であっていると思います.

退会済みユーザー

2021/06/01 05:38

回答者のみなさん、そもそも質問の意味わかってます？私は質問文の意味（「質問者さんが何をおかしいと思っているのか」）が、質問文からはまったくわかりません。質問者さん：次のような理解であってますか？ ’’’ 「for n in range(5000,100000,5000):」と「 for j in range(N):」のループを削除して、 n=100000だけに設定して実行したら、 lap2は「3秒」と表示された。しかし for n とfor j のループを削除せずに、質問文記載のコードの通りに実行すると、 lap2は「12秒」と"表示された"。同じコードを同じように実行しているだけなのに、明らかに後者の方が遅い時間として"表示"される。これがなぜだかわからない’’’’ 質問者さんが「聞きたいこと」はこのような理解であってますでしょうか？

2021/06/01 05:38

myBytes = {} の行の次に st0_time = time.time() を追加コードの一番下(インデント無し)に print(time.time()-st0_time) を追加上記をしてから実行したら、最後にコード全体の実行時間が表示されますそれと、ave1, ave2の表示される全部の合計を10倍したものは、全然違うのですか？

2021/06/01 05:44

インデントなしに print(time.time()-st0_time)を入れると全てのforを抜けた後になるので,それを10倍してもそれぞれの計算時間にはならない気がしますが,その位置で大丈夫でしょうか.

2021/06/01 05:45

今のprintがある位置の下に入れたらそれぞれのnに対しての実行時間が分かりませんか?

2021/06/01 05:47 編集

現状の形を上に追加しました.インデントもそのまま示されています.

2021/06/01 05:48

10倍するのは、ave1, ave2を全部足したもの ave1, ave2は、「n」が変わる度に表示されるので、それぞれ19回表示されますよね？それら38個の数値を全部足して10倍するそれと、print(time.time()-st0_time) の表示を比べる (こちらは10倍しないでそのまま)

2021/06/01 05:57

仮に、「n」が変わっても、計算時間はほとんど変わらないとします 19個のave1はほとんど同じ、19個のave2もほとんど同じ場合ですその場合、 (ave1 + ave2) * 10 * 19 ≒ print(time.time()-st0_time) になるはずなのですが、それが全然合わないのだろうか？？ともちろん、「n」によって計算時間がかなり変わるなら、上記のような安直な計算はできず、地道に全部のave1, ave2を足さないといけない

2021/06/01 05:57

計算量が多くなってしまうので,n=15000までで計算してみたのですが, processing time：0.02545895576477051 0.009452056884765626 True processing time：0.04150521755218506 0.022467756271362306 True 1.0012428760528564 のように出力されて4つの和が0.0988839864730835だったので10倍しても一致しません. のような結果になって

2021/06/01 06:00

processing time：0.02383921146392822 0.008798360824584961 True 0.3307487964630127 processing time：0.04224090576171875 0.022389841079711915 True 0.9837450981140137 それぞれで合計時間を出してみたのですが,これもave1+ave2が等しくなっていないです.

2021/06/01 06:01

nによって計算時間は大きく変わります.

2021/06/01 06:09 編集

> 1.0012428760528564のように出力されて > 4つの和が0.0988839864730835だったので10倍しても一致しません 0.0988839864730835*10=0.988839864730835 と 1.0012428760528564 が一致しない、と言ってるのですか？差は 0.988839864730835-1.0012428760528564=-0.012403011322021484 と0.01秒ほどで、ave1, ave2で時間測ってるところ以外のループ回すところとかでかかってる時間だと思いますが

2021/06/01 06:10

ではこの結果だけで言えば,10回の平均が求まっていると言って良いのですか. お分かりの通り私は知識が豊富ではないのですが,全く一致していなくでもこの程度の時間差なら等しいと言って良いのですか.

退会済みユーザー

2021/06/01 06:15 編集

>4つの和が0.0988839864730835だったので10倍しても一致しません. （手計算お疲れ様です）一致しないとしても、 1.0012428760528564　-　0.0988839864730835*10 ＝0.012403011322021484(秒）というように、差は大変小さいので、n=15000までの範囲では、ほとんど違わない、と考えていいでしょう。つまり、jbpb0さんが多分確認したかったであろう「makeSuffixArrayByInducedSortingとnaivelyBuildSA”以外"の部分に体感できるほどの計算時間がかかっているのか否か」については、n=15000までの範囲では、おそらくNOである、ということです。（個人的な推測ですが、n=100000にしても特に差は大きい数値にならないでしょう（いって0.1秒））

2021/06/01 06:14

print("processing time：{} {} {}".format(ave1,ave2, xR==nR)) print(time.time()-st0_time) のようにインデントを揃えて配置した場合2つ目のprintで出力されるのはave1とave2の和を10倍したものと一致すると考えて良いですか.

2021/06/01 06:15

n=100000も試してみたほうが良いですか?

2021/06/01 06:21 編集

> それぞれで合計時間を出してみたのですがは、最後の「print(time.time()-st0_time)」のインデントを、その前の「print("processing...」に合わせる、という意味ですかね？もしそうなら、「st0_time = time.time()」の位置を、 for j in range(N): のすぐ上に変えないといけません > 2つ目のprintで出力されるのはave1とave2の和を10倍したものと一致すると考えて良いですか上記を行えば、そうなります

退会済みユーザー

2021/06/01 06:20 編集

>一致していなくでもこの程度の時間差なら等しいと言って良いのですか. 厳密にいえば、等しくはないですが、差が小さければ特に問題になりません。 >インデントを揃えて配置した場合2つ目のprintで出力されるのはave1とave2の和を10倍したものと一致すると考えて良いですか. →修正します。これについてはjbpb0さんの書かれた通りです。

2021/06/01 06:19

であればこれは比較対象が間違っていますね.今は全体の時間で考えます.

2021/06/01 06:21

>baitokunさん分かりました. ありがとうございます.

2021/06/01 06:30 編集

たくさんのave1, ave2を足すのが面倒なら、下記のように変えたら簡単になります lap1_time =0 lap2_time =0 を for n in range(5000,100000,5000): よりも上に移す ave1=lap1_time/N ave2=lap2_time/N print("processing time：{} {} {}".format(ave1,ave2, xR==nR)) のインデントを無くす ave1=lap1_time/N ave2=lap2_time/N の「/N」を取る (割り算やめる) そうすれば、ave1, ave2(名前が良くないけど)はコード全体の合計値になるので、ave1+ave2はコード全体の計算時間とだいたい合うはず (10倍とかしなくていい)

2021/06/01 06:36

n=95000単体で求めるとprocessing time：0.4466898441314697 3.4324429035186768 True となってこのプログラムを使って求まったものがprocessing time：0.41282033920288086 2.7798306941986084 Trueと微小な差ですがこれをn=100000にすると単体だと10秒くらいと出て,このプログラムだと4秒くらいになるのが私の疑問点です.

2021/06/01 06:38

>jbpbさんやってみます.

2021/06/01 06:42

自分のミスで95000までの時間になっています. processing time：39.85334515571594 168.13135766983032 True 208.5171971321106 大体一致はしています.

退会済みユーザー

2021/06/01 07:08 編集

>これをn=100000にすると単体だと10秒くらいと出て,このプログラムだと4秒くらいになるのが私の疑問点です. ああ、そういうことですか。やっとあなたが知りたい疑問点が分かりました。これは naivelyBuildSAの具体的なプログラムを載せてもらわないと、だれも何とも言えないと思いますよ？質問のプログラムの通りならば、・単体でn=100000のとき　naivelyBuildSAが10秒かかった、・n を5000から95000まで、5000刻みで実行したときにn=95000のときの最後の10回目のnaivelyBuildSA（lap2）が3～4秒しかかからなかったということですよね？後者はたまたまキャッシュ？等が利いて早く実行された、という可能性がゼロではないと思いますが、実際のコードで検証しないと何とも言えない。

2021/06/01 06:48

(39.85334515571594+168.13135766983032)/208.5171971321106=0.9974462811034863 ですから、総合計時間の内の99.7%は、二つの関数の計算時間である、ということですよく合ってると思いますけど

2021/06/01 06:48

>・単体でn=100000のとき　naivelyBuildSAが10秒かかった、・n を5000から995000まで、5000刻みで実行したときにn=95000のときの最後の10回目のnaivelyBuildSA（lap2）が3秒しかかからなかったということですよね？そうです. 単純に求めたコードは import time NA ='ACGT' n = 100000 s = '' myBytes = (s.join([random.choice(DNA) for i in range(n)])).encode() st1_time = time.time() xR = makeSuffixArrayByInducedSorting(myBytes,256,0,False) et1_time = time.time() lap1_time = et1_time-st1_time st2_time = time.time() nR = naivelyBuildSA(myBytes) et2_time = time.time() lap2_time = et2_time-st2_time print("processing time：{} {} {}".format(lap1_time, lap2_time, xR==nR)) このような形です.このコードと上のプログラムで10回の平均を求めた結果とこんなにも差が出るものですか.

退会済みユーザー

2021/06/01 10:09 編集

ちなみにネットで makeSuffixArrayByInducedSorting　を手掛かりに検索して出てきたコードを私の手元で実行した限りでは、naivelyBuildSAに該当する関数（実際には「naivelyMakeSuffixArray」という名前）が含まれるコードを n=100000で10回繰り返して各回の実行時間を計測しましたが、 1回目～10回目まで、どの回でも15秒～20秒かかっています。 1回目も10回目もブレはあるにしても15～20秒の範囲でバラバラの秒数であり、後になるにしたがって早くなるという現象は起きていません。（Intel Core i5 9400F 2.9GHz/Windows 10/Python 3.9.5 Visual Studio Code上のPowerShell）ただし私の手元のコードとあなたのコードが同じかどうかはわからないので、「何とも言えません」

2021/06/01 06:50

>よく合ってると思いますけど私もそう思います. ただ,一つ前に載せたコメントで求めたものと大きく時間が違うので,プログラムとしては10回平均を求めているのに平均を求めた方が計算時間が早くなるのは腑に落ちない部分があります.

2021/06/01 06:52

もし可能であればそのnaivelyMakeSuffixArrayを載せていただけますか.こちらで一致しているか確認します.

2021/06/01 06:56

>>> def naivelyMakeSuffixArray(source): ... """ ... A naive, slow suffix-array construction algorithm. ... """ ... ... # Construct a list of suffixes of the source string. ... suffixes = [] ... for offset in range(len(source) + 1): ... suffixes.append(source[offset:]) ... ... # Sort the suffixes ... suffixes.sort() ... ... # Calculate the start offset of each suffix, storing them in ... # sorted order into the suffix array. ... suffixArray = [] ... for suffix in suffixes: ... offset = len(source) - len(suffix) ... suffixArray.append(offset) ... ... return suffixArray ですか？

2021/06/01 07:06 編集

> これをn=100000にすると単体だと10秒くらいと出て for n in range(5000,100000,5000): のループには「n=100000」の場合は含まれませんループに含まれない条件の時間と、ループの総合計時間を比べて「合わない」と言われてもそこが気になるなら、ループを for n in range(5000,100001,5000): に変えて時間測ったらいいのでは？？

2021/06/01 07:09

申し訳ございません. 確認します.

2021/06/01 07:14

ave2の方がずれているのでave2の方だけ言うと単体:9.259315967559814 プログラム:processing time：4.121449637413025 です.

2021/06/01 07:14

たまたま単体の方はこの秒数なわけではなく,いつも10秒付近です.

退会済みユーザー

2021/06/01 07:15

環境要因かもしれないので、OSと実行環境、pythonのバージョン、CPU、メモリを教えてください。

2021/06/01 07:20

python3でjupyternotebookを使っています. 環境はMacOSでCPUは2.0GHz,メモリは8GBです.

2021/06/01 07:22

OSのバージョンは11.4 Mac OS Big Surです. Python 3.8.8です.

退会済みユーザー

2021/06/01 07:29 編集

2.0GHzということは、MacのCPUはM1ですか？ Mac book pro？　いずれにしても自分はIntelなので同じ条件で計測できません。

2021/06/01 07:30

Mac book proです.

2021/06/01 07:34 編集

ループを for n in range(5000,100001,5000): に変えて時間測ったら、総合計時間と、ave1+ave2のどちらも、10*10=100秒くらい増えて、結果やはり時間合いました、になるのではないですかね「n=100000」での計算1回あたり約10秒で、 for j in range(N): のループで10回計算されるから、10秒の10倍 ave1, ave2の計算は、総合計バージョンの場合です (2021/06/01 15:29のコメント)

2021/06/01 07:44

processing time：0.027766036987304687 0.013672447204589844 True processing time：0.04400126934051514 0.02627565860748291 True processing time：0.0701488733291626 0.05143883228302002 True processing time：0.09950840473175049 0.08780455589294434 True processing time：0.10814404487609863 0.119659423828125 True processing time：0.1344465732574463 0.15548162460327147 True processing time：0.15326950550079346 0.23942835330963136 True processing time：0.1734851121902466 0.38886399269104005 True processing time：0.18961904048919678 0.5400986194610595 True processing time：0.21131110191345215 0.7217737436294556 True processing time：0.2361222267150879 0.9357278347015381 True processing time：0.2673609256744385 1.167260479927063 True processing time：0.32854504585266114 1.711254620552063 True processing time：0.3717369556427002 2.1400886297225954 True processing time：0.3733197212219238 2.351224398612976 True processing time：0.43237712383270266 2.970620846748352 True processing time：0.42038469314575194 3.0756006479263305 True processing time：0.4015098333358765 2.96927649974823 True processing time：0.42518389225006104 3.8412546873092652 True processing time：0.5294559717178344 6.706105041503906 True 352.86083817481995 これがfor n in range(5000,100001,5000):でしてみた結果です.

退会済みユーザー

2021/06/01 07:57

for n in range(5000,100001,5000)　で最後が6.7秒単体n=100000だと10秒 3.3秒を誤差と見るか、大きな差と見るか、ですね。

2021/06/01 08:01 編集

> ave1, ave2の計算は、総合計バージョンの場合です (2021/06/01 15:29のコメント) でやってほしかっためんどくさかったけど、20個のave1, ave2を全部足したら、35.21060729でしたそれを10倍したら、352.1060729ですそれを352.86083817481995で割ったら、0.997861012です総合計時間の99.8%がave1, ave2で説明できますまだ「腑に落ちません」か？ちなみに、一番下のave1, ave2 processing time：0.5294559717178344 6.706105041503906 True の合計7.235561013秒が、n=100000での計算時間の10回平均

2021/06/01 08:09

ループを for n in range(100000,100001,5000): に変えて実行してみてくださいそうしたら、「n=100000」での計算だけを10回やりますその時の総合計時間(一番最後に表示される数値)はいくつですか？それを10で割った数値が、「n=100000」単独の計算時間です 1回だけで測るよりも、10回平均の方が信頼できます

2021/06/01 09:52

>jbpb0さん色々と申し訳ございませんでした. 私が意図していることとずれていないか確認したいのですが,ave1はlap1の10回平均,ave2はlap2の10回平均で私はそれぞれの10回平均を求めたいという認識で間違っていないですよね？ >for n in range(100000,100001,5000):の結果は processing time：0.5066619873046875 7.232007169723511 True 77.4687888622284 です.

2021/06/01 09:57 編集

これがやはり単独計算と差が出てしまうのが個人的には不思議です. しつこくてごめんなさい.

退会済みユーザー

2021/06/01 12:20 編集

単独でやると10秒 10回繰り返して平均したところ7.7秒、ということですよね？で＞やはり単独計算と差が出てしまうのが個人的には不思議です. という疑問に答えるためには、次に「1回目から10回目はそれぞれ何秒かかっているのか」を確認する必要があると思います。仮に1回目が単体でやったときと同じ10秒くらいかかっていて、回数を繰り返すにしたがってだんだん早くなっているならば「同じ処理を繰り返している」ためにだんだん速くなっているのだ、と推測できます。（当初の質問のコードで「３～４秒しかかからなかった」理由は、n=100000より5000少ないn=95000の、しかも10回繰り返したときの最後の結果だけしか表示されていなかったから、です）ではなぜ同じ処理を繰り返していると速くなるのか、の本当の理由については、実際のコードを掲載していただかなければ解析しようがないと思います。もっとも、実際は速度がばらばらで、たまたま最後が速かっただけ、という可能性もあります。

2021/06/01 10:08 編集

> ave1はlap1の10回平均,ave2はlap2の10回平均そうです > processing time：0.5066619873046875 7.232007169723511 True > 77.4687888622284 から、「n=100000」での10回計算の総合計時間は77.5秒なので、1回あたりは平均約8秒ですその内の約7秒がave2、すなわち「naivelyBuildSA()」でかかってる時間です

2021/06/01 10:16 編集

10秒と言ってますが、実際は > ave2の方がずれているのでave2の方だけ言うと単体:9.259315967559814 9秒のこともあるのですよね 10秒が、どこまで正しいのか？？【追記】上記9秒は、1回計算のave2だけの時間ですね失礼しました

2021/06/01 12:06

>baitokonさん内容理解しました. ありがとうございます.

2021/06/01 12:13

>jbpd0さん >9秒のこともあるのですよね 10秒が、どこまで正しいのか？？よく考えればそうですね. 一度1から2とか10回にせずにやってみます.

2021/06/01 12:26

やはりその時の環境によって誤差は出ます. 先ほどYouTubeをつけながら計測してみたら単体だと15秒でした. 短くなることはあまりないような気がします.

2021/06/01 12:51 編集

皆さん少し自分の中で理解ができたような気がします. 今N=1から少しずつ増やして行っているのですが,Nが小さいとave2が10秒という値が出ます.どういう理由かは分かりませんが,Nを増やすと計算時間が短くなるようなことがあるという発想が自分の中ではありませんでした. N=1は10秒程度だったり8秒だったりもするのですがN=2以上にすると8秒だったり7秒だったりしてNを7など大きい値にするほど4秒程度に収束するような感じです.

2021/06/01 12:36

自分の知識不足で皆さんを巻き込んでしまい申し訳ございませんでした. ご対応いただいた方本当にありがとうございました. jbpb0さんいつもありがとうございます.

行動規範の内容に同意します

回答2件

0

測定に影響する要因は多数あるので。以下のことに気をつけてください。

CPUの省電力設定(BIOSで設定)

　省電力設定がenableになっていると、負荷が低いときはクロックが遅くなっているため、高負荷の場合にくらべて長い時間がかかるけいこうがある。
省電力設定はdisableにしておきましょう。

キャッシュに載っているかどうか

　最初に一回ダミー実行をしてコードをキャッシュに載せ、データも可能な限りキャッシュに載せる。

データのページ内配置

　データがページング単位の1ページに入っているか、複数ページにまたがっているかで性能に差が出ることがある。コントロールは難しい。

以下はPythonに特有のものです。

ライブラリの読み込み時間

　Pythonの場合は、Numpy、Scipy、Pandasなど、読み込み時間がかかるものが多い。
測定するときはimportが全て終わった時点から測定を開始することで正確に測定できます。

for文のオーバーヘッド

　Python3になってfor文のオーバーヘッドが増えました。
for文で10回繰り返しをするより、同じことを10回書いた方が正確に測定できます。

こういうことに注意して測定し直してみてください。

投稿2021/06/01 13:29

総合スコア24670

2021/06/01 22:45

分かりました. ありがとうございます.

行動規範の内容に同意します

0

コメントで

もし可能であればそのnaivelyMakeSuffixArrayを載せていただけますか.こちらで一致しているか確認します.

との要望がありましたので、記載します。

def naivelyMakeSuffixArray(source):

     """
     A naive, slow suffix-array construction algorithm.
     """

     # Construct a list of suffixes of the source string.
     suffixes = []
     for offset in range(len(source) + 1):
         suffixes.append(source[offset:])

     # Sort the suffixes
     suffixes.sort()

     # Calculate the start offset of each suffix, storing them in
     # sorted order into the suffix array.
     suffixArray = []
     for suffix in suffixes:
         offset = len(source) - len(suffix)
         suffixArray.append(offset)

     return suffixArray

投稿2021/06/01 07:06

退会済みユーザー

総合スコア0

2021/06/01 07:31

ありがとうございます.全く同じではないようです.

退会済みユーザー

2021/06/01 07:41

コメントに貴方が書かれたソースと、どこがちがうのでしょうか？(コメントではインデントがわからないのですが、インデントが異なるのでしょうか？）

2021/06/01 07:45

私が書いたのはサイトからのコピペで私が実際に使っている関数とは異なります.

退会済みユーザー

2021/06/01 12:59 編集

承知しました

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ MacOS(OSX)に関する質問

平均処理時間が明らかに一致しない

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る