質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2438閲覧

Python 3.x 辞書のキー値によって多次元配列を変換する場合の高速化

KK-31

総合スコア22

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/02/28 00:11

編集2018/02/28 00:52

Pythonにて、辞書(dict({key,value})を使って、list型の全要素をValue値に変換する際の、
高速化が可能かどうかをご教授いただきたいです。
(同じような質問を過去にも投稿しております、その際は1次元配列の場合の高速化で、今回は多次元配列の場合です。)

python

1import time 2 3dic_N= 10000 #辞書の要素数 4target_size = 100 #置換対象の配列の長さ 5target_N = 100000 #置換対象の2次元配列の長さ 6dict1 = {('%06d'%i):i for i in range(dic_N)} #辞書を宣言 7#dict1 = {'000000': 0, '000001': 1, '000002': 2, '000003': 3, '000004': 4, '000005': 5, '000006': 6, '000007': 7, '000008': 8, '000009': 9, ...... 8target_list = [[('%06d'%(i%target_size)) for i in range(target_size)] for i in range(target_N)] #多次元配列の例です。 (大量にデータがある事を想定 9#target_list[0] =['000000', '000001', '000002', '000003', '000004', '000005', '00 ... 10#target_list[1] =['000000', '000001', '000002', '000003', '000004', '000005', '00 ... 11new_list = [] #list初期化 12start = time.time() 13#---------↓ここを高速化させたい------------------------- 14new_list = [ list(map(dict(dict1).get, document)) for document in target_list] 15#new_list = [[1,2,3,4,5,6...],[1,2,3,4,5,6...],[1,2,3,4,5,6,...]] 16#---------↑ここを高速化させたい------------------------- 17print ("処理完了 経過時間:{0}".format(time.time() - start) + "[sec]") 18#処理完了 経過時間:52.82347846031189[sec]

上記コードのように、一応内包表記はしているのですが、速度改善のための方法を教えていただきたいです。
現在は、並列処理で高速化していますが、何かライブラリ等で似たようなことを実現できないでしょうか。

実行環境:AWS仮想サーバー
Pythonバージョン:Python3.6
CPU:vCPU 6コア
メモリ:16GB
OS:Windows 2016
実行環境:Powershell(CLI)から実行。

追記 '18 2/28 9:52
前回の質問のリンク
teratail前回の質問のリンク

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/02/28 00:46

前回の質問のリンクを追加願えませんでしょうか。
guest

回答1

0

ベストアンサー

  1. target_listは入れ子要素をtupleにしてsetにしておくとdocument in target_listの部分が早くなる。
  2. dict(dict1).getdict1.getで良い。

投稿2018/02/28 00:50

YouheiSakurai

総合スコア6142

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KK-31

2018/02/28 01:01

ありがとうございます。 単純に dict(dict1).get が足を引っ張っていたみたいでした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問