numbaによる高速化について

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Python 3.xに関する質問

Q&A

解決済

2回答

1020閲覧

numbaによる高速化について

総合スコア9

0グッド

0クリップ

投稿2018/07/19 05:12

0

0

前提・実現したいこと

pythonでバイナリファイルを読み込む関数(bin_read)を高速化しようとしています．
環境はpython3.6

発生している問題・エラーメッセージ

numbaを導入して高速化を図ったのですが，jitありとjitなしで速度がほとんど変わりません．

該当のソースコード

python
1import numpy as np
2import struct
3import time
4from numba import jit
5
6def bin_read(fid,data_length,offset=0):
7    if offset!=0: fid.seek(offset*2,0)
8    data=np.zeros(data_length,dtype=None)
9    for i in range(data_length):
10        data[i]=struct.unpack('h',fid.read(2))[0]
11    return data
12
13@jit
14def bin_read_jit(fid,data_length,offset=0):
15    if offset!=0: fid.seek(offset*2,0)
16    data=np.zeros(data_length,dtype=None)
17    for i in range(data_length):
18        data[i]=struct.unpack('h',fid.read(2))[0]
19    return data
20
21if __name__ == '__main__':
22    fs=10*10**6
23    duration=0.5
24    fid = open('test.bin','rb')
25    t1 = time.time()
26    data=bin_read(fid,int(duration*fs*2))
27    t2 = time.time()
28    print(type(data))
29    elapsed_time = t2-t1
30    print("elapsed_time")
31    t1 = time.time()
32    data=bin_read_jit(fid,int(duration*fs*2))
33    t2 = time.time()
34    elapsed_time = t2-t1
35    print("elapsed_time")

試したこと

↓このサイトに載っていたサンプルプログラムを試して実行速度が上がることは確認したので，numbaはしっかりインストールされていると思われます．
http://yutori-datascience.hatenablog.com/entry/2014/12/09/235628

行動規範の内容に同意します

回答2件

0

ベストアンサー

原理的にI/Oバウンドになることと、主要な処理をそれなりに高速なライブラリ群にまかせているので、numbaを使った高速化はあまり期待できません。

先に丸ごとバイト列として読み込んでおくと、また違った結果になるかもしれません。

ところで、質問文のコードだと関数内でfidに対して副作用がある気がしますが、二回目のjit版の方の呼び出し時に問題が起きませんか？

投稿2018/07/19 05:24

総合スコア30933

2018/07/19 05:33

ご回答ありがとうございました． fidについてのご指摘もありがとうございます．確かにこの書き方は問題がありますね．今回の場合はファイルの一部のみ読んでいるのでエラーが発生せず気づきませんでした．

2018/07/19 05:36

ファイルを読みたいなら、 https://docs.scipy.org/doc/numpy/reference/generated/numpy.fromfile.html が使えませんか dtypeにnp.int16あたりを指定すればできそう

2018/07/19 05:57

np.fromfile(fid,np.int16,1) とすることで同じ様に読み込みはできますが以前の方法と比較するとかなり遅いですね．またこれも高速化はされませんでした．

行動規範の内容に同意します

0

pythonの実行速度をいくら早くしようと、ファイルのアクセスの速度は変わりません。

投稿2018/07/19 05:29

総合スコア87774

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Python 3.xに関する質問

numbaによる高速化について

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る