質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

処理を高速化するため、内包表記の仕方を教えていただきたいです。

matsutai
matsutai

総合スコア21

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0評価

1クリップ

382閲覧

投稿2021/12/31 07:03

for if文を使うよりも、内包表記のほうが処理時間が高速であるようなので、
下記のdf1、df2のデータフレームを使って、df2の直交部を置き換えるコードを、内包表記で書きたいのですが、書き方を教えていただきたいです。(今回のデータフレーム例ですが、実際はもっとデータ行列数が多く、少しでも計算時間を短くしたいです)

python

df1 = pd.DataFrame(data={0: ['A','B','C'],1: ['a','b','a'],2: ['+','-','+']})     0 1 2 0 A a + 1 B b - 2 C a + df2 = pd.DataFrame(data={0: [np.nan,'A','B','C'],1: ['a',1,np.nan,1],2:['b',np.nan,-1,np.nan],3:['f',np.nan,np.nan,-1]})     0 1 2 3 0 NaN a b f 1 A 1 NaN NaN 2 B NaN -1 NaN 3 C 1 NaN -1 for i in range(len(df1.index)) : for j in range(1,len(df2.index)) : for k in range(1,len(df2.columns)) : if df1[0][i] == df2[0][j] : if df1[1][i] == df2[k][0] : df2[k][j] = df1[2][i] df2.head() 0 1 2 3 0 NaN a b f 1 A + NaN NaN 2 B NaN - NaN 3 C + NaN -1

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

ppaul

2021/12/31 08:19

for if文を使うよりも、内包表記のほうが処理時間が高速であるようなので、 とのことですが、内包表記では処理時間は速くなりません。 高速化したいなら、他のことを勉強することをお勧めします。
matsutai

2021/12/31 11:27

ご指摘ありがとうございます。 勉強のために、質問させていただいたコードの内包表記の仕方を教えていた抱けますでしょうか。 よろしくお願いします。
fourteenlength

2022/01/01 04:50 編集

答えではないのでコメント欄に… 確かに内包表記のカスケードで"いくらかは"早くなるとは思います。 # https://www.geeksforgeeks.org/nested-list-comprehensions-in-python/ が、デメリットが大きいです 1. 可読性が大変なことになる(慣れ次第?) 2. その結果、あとから書き換えようとすると涙目に(経験あり) 個人的にはnumbaがおすすめです。from numba import jitのやつです。 dataframeは使えない、一部のNumpyの関数は対象外など制限はありますが、 生のPythonで三重、四重になったforのカスケードをぶん回すよりは格段に速いです。 10倍高速化はザラにありますし、100倍、1000倍高速化もあり得る話です。 https://qiita.com/ryo_naka/items/6d6a575d0c47bb792f71
lehshell

2022/01/04 12:53

リストの内包表記は、リスト生成の構文です。 ご提示のコードはすでに存在する df2 リストの要素を更新するものです。 もし内包表記が使用できても、無駄に使用しないリストを生成するため処理時間は遅くなるのでは?

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。