実現したいこと
csv出力部分(to_csv)の処理の実行時間の短縮
前提
Pandasのto_csvメソッドでデータフレームをcsv出力していますが
データ量が膨大ということもあり、csv出力に時間がかかっています。
自分のPCでの処理時間: 83.74789秒
発生している問題・エラーメッセージ
特になし。
該当のソースコード
Python
1import pandas as pd 2import time 3 4start = time.perf_counter() 5 6# データフレームの作成 7df = pd.DataFrame(index=range(100000), columns=range(200)) 8 9# データフレームに0から順番にデータを入れる 10for i in range(100000): 11 for j in range(200): 12 df.iat[i, j] = i*200+j 13 14# CSVファイルに出力 15df.to_csv("output.csv", index=False, , encoding="utf_8_sig") 16 17end = time.perf_counter() 18print(f"処理時間: {end - start:.5f}秒")
試したこと
to_csvの代わりにcsv.writerを使用してcsv出力しましたが
ファイルサイズがより大きくなり、処理時間は変わりませんでした。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー