質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.34%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

1回答

155閲覧

python のfor文でDataFrameを分割し再形成している処理を高速化したい

spring1114

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2024/09/17 11:26

実現したいこと

ゲームのユーザーのプレイログのデータをpythonで処理しています。
ゲームからプレイデータは以下のような形式で出力されます。
ユーザーID,操作順,得点
aaaa,0,10
aaaa,1,2
aaaa,2,100



aaaa,13,20
bbbb,0,5



zzzz,13,40

プレイログの情報から得点の統計情報を取得するために、
各ユーザーIDを持つ列を作成して、操作順に得点を格納することを考えています。

発生している問題・分からないこと

以下のソースコードで実装することができましたが、ユーザーIDが30000を超えると
処理時間が長時間に及びます。
こちらの処理を高速化する方法についてご教示いただけますと幸いです。

該当のソースコード

python

1def point_mean(gamedf): 2 poinitdata=[] 3 resultdf = pd.DataFrame() 4 useriddf=gamedf.drop_duplicates('user_id') 5 useridlist=useriddf['user_id'].values.tolist() 6 for userid in useridlist: 7 poinitdata.append(gamedf.query('user_id==@userid')['point'].values.tolist()) 8 tmp=pd.DataFrame(poinitdata,index=useridlist) 9 resultdf=pd.concat([resultdf,tmp.T],axis=1) 10 result.dropna(axis=1,inplace=True)

試したこと・調べたこと

  • teratailやGoogle等で検索した
  • ソースコードを自分なりに変更した
  • 知人に聞いた
  • その他
上記の詳細・結果

pythonではfor文が遅いということはわかりましたが、改善策はわかりませんでした。

補足

特になし

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2024/09/17 11:51

groupbyは使えませんか?
spring1114

2024/09/17 15:55

データに含まれる欠損値の処理が特殊だったので見送っていましたが、事前処理として欠損値を排除するようにして groupbyに変更したら劇的(4683s → 6.2s)に処理時間が解決しました。 ありがとうございました!
spring1114

2024/09/17 15:59

ベストアンサーに選びたいので同じ内容を回答欄に投稿いただけますでしょうか?
guest

回答1

0

※ 削除​​​​​​​​​​​​

投稿2024/09/17 12:56

編集2024/09/18 01:06
melian

総合スコア20710

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

spring1114

2024/09/17 15:57

コードの提示ありがとうございました。上のコメントでも書いている通りgroupbyによって劇的に改善しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.34%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問