####【やりたいこと】
csvファイル中の80万行×14列のデータの中で複数条件にあてはまった列が存在する行ごとに個数をカウントし、その個数を新しい列に出したい。
↓
アドバイス等頂いた方々のおかげでカウントのためのスクリプトがかけました.
↓
【今ここ】
しかし,現在の書き方では80万×80万のデータ参照→カウント→出力が行われているはずなので,データ集計をもっと効率的に行いたいのです.
####【質問内容】
現在のスクリプトをどのようにしたらもっと効率的に作業が行われるのか知りたい.
####【現在のスクリプト】
"""csvデータをインポート""" T = pd.read_csv(r'C:\Users****\Desktop\py\T.csv') """条件にあったデータのカウント""" T['FlontVCount'] = T.apply(lambda r: ((T['SimSec']==r['SimSec']) & (T['Lane']==r['Lane']) & (T['SD']<r['SD'])).sum(), axis=1) """csvデータをエクスポート""" T.to_csv("T.csv",index=False,encoding='UTF_8_sig')
###出力される'T.csv'データ
下の画像は少ないデータでやった時のものです.上手くいけばFlontVCountが加わる.
回答1件
あなたの回答
tips
プレビュー