大容量CSVをどうしてもpandasで処理したくて、
最初の行から分割して読み込み、処理済みのcsvファイルに追記するコードを作成しています。
下記コードを作成しましたが、結果は3行のデータファイルができるだけです。
予定では300行のデータファイルができるはずだったのですが・・・
どこに問題があるのか または もっと良い方法があればアドバイスをお願いします。
import numpy as np import pandas as pd files1 = "./big_data.csv" files2 = "./test.csv" df= pd.read_csv(files1,skiprows=lambda x: x not in [0,100]) df.to_csv(files2,header=True) df= pd.read_csv(files1,skiprows=lambda x: x not in [101,200]) df.to_csv(files2,mode='a', header=False) df= pd.read_csv(files1,skiprows=lambda x: x not in [201,300]) df.to_csv(files2,mode='a', header=False)
回答2件
あなたの回答
tips
プレビュー