前提・実現したいこと
チャットボットのQ&AをWEBから取り込む
際、10メガずつしか取り込めないため、
100000行データを8000行ずつ11の
CSVファイルを作成する必要があります。
CSVの形式はshift-jisでなければ
取り込みできません。
ネットでしらべて、PYTHONによる
分割方法があることが分かりました。
SHIFT-JIS(ANCII)
のCSVを
下記コード
df = pd.read_csv('test.csv')
span = 8000
for i in range((len(df)+span-1)//span):
df[spani:span(i+1)].to_csv(f'test{i}.csv', index=False)
実際にVSCODEで実行すると
出来上がったCSVが文字化けしています。
メモ帳でみると文字化けしないので
UTF-8に出力しているためだと思いました。
SHIFT-JISで出力するにはencoding='shift_jis
とする必要があると思い
df = pd.read_csv('test.csv'shift_jis)
span = 8000
for i in range((len(df)+span-1)//span):
df[spani:span(i+1)].to_csv(f'test{i}.csv',encoding='shift_jis,index=False)
としましたがエラーとなりました。
SHIFT-JISで出力するには上記コードをどのように変更する必要がありますでしょうか?
プログラミン初心者です。どうぞ、よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー