質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

1424閲覧

python pandas for文 処理速度を早くするコードの書き方ないでしょうか?

icemanstanding

総合スコア73

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/09/10 20:46

pandasのDATAFRAMEで、name毎に2021/10/1~2021/1031までの表を作りたいのですが、
作成が遅くて困っています。

もっと早く処理できるコードの書き方があれば、アドバイスをいただきたい。

多分、FOR分の中にif文が入っているので遅くなってるよう考えています。

col=df_all["name"].unique() j=0 for i in col: df1 = pd.DataFrame( pd.date_range(start='2021/10/1', end='2021/10/31', freq='D'), columns=["DAY"]) df1['name']=str(i) if j==0: df2=df1 j=j+1 else: df2=pd.concat([df2, df1]) j=j+1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

Pandasでcross joinを行いたいを参考にしてDAYとnameの交差結合を行います。
そのさい、元コードと同じ行の並びになるようにnameidを振っておきます。
交差結合後、id,DAY順で並べ替えます。

Python

1import pandas as pd 2 3df1 = pd.DataFrame({ 4 'DAY':pd.date_range(start='2021/10/1', end='2021/10/2', freq='D'), 5 'key':1 6}) 7 8col = list('cba') 9df2 = pd.DataFrame({ 10 'name':col, 11 'id':[i for i,_ in enumerate(col)], 12 'key':1 13}) 14 15df = df1.merge(df2, how='outer').drop(columns=['key']) 16df = df.sort_values(['id','DAY']).drop(columns=['id']).reset_index(drop=True) 17print(df) 18""" 19 DAY name 200 2021-10-01 c 211 2021-10-02 c 222 2021-10-01 b 233 2021-10-02 b 244 2021-10-01 a 255 2021-10-02 a 26"""

追記

pandas 1.2.0以降であればcrossが使えるので直接交差結合できます。
そのさいnameDAYを結合すると、列の並びは元コードと変わりますが、おそらく行ソートも不要になります。

pandas.DataFrame.merge

cross: creates the cartesian product from both frames, preserves the order of the left keys.

とあるので左側(name)の並びは保持されますが、おそらく右側(DAY)の並びも大丈夫でしょう。

Python

1import pandas as pd 2 3df1 = pd.DataFrame({'DAY':pd.date_range(start='2021/10/1', end='2021/10/2', freq='D')}) 4 5col = list('cba') 6df2 = pd.DataFrame({'name':col}) 7 8df = df2.merge(df1, how='cross') 9print(df) 10""" 11 name DAY 120 c 2021-10-01 131 c 2021-10-02 142 b 2021-10-01 153 b 2021-10-02 164 a 2021-10-01 175 a 2021-10-02 18"""

投稿2021/09/11 01:35

編集2021/09/11 02:16
can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bsdfan

2021/09/11 02:01 編集

新しめのpandas(1.2.0以降)だとmergeにhow='cross'が使えるので、もっと簡単に書けますね。
can110

2021/09/11 02:17

知りませんでした。便利ですね。情報ありがとうございます。
icemanstanding

2021/09/11 02:20

ありがとうございます。ただの結合エラーだと思っていましたが、「交差結合」という名前のついた技術だったんですね・・・・
can110

2021/09/11 02:29 編集

ですね。分野でいえば関係データベース(SQL)などで一般的な用語です。 https://wa3.i-3-i.info/word15314.html pandasはこの分野と親和性の高いパッケージですので、このあたりの知識があるといろいろと便利です。
guest

0

if文が最初の一回しかtrueとしないなら、最初のループの一回分をforの外に出せばどうでしょう
そうすればif文をなくせます

投稿2021/09/10 22:13

y_waiwai

総合スコア88051

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問