やりたいこと
ファイル内にある下記のフォーマットのCSVファイルがあります。
file_n.csv(nは110)eは事前に計算をしている数字が入ります。)
年,A,B,C,D,E,
2019_n,a,b,c,d,e
(a
そこでファイル内に
file_1.csv~file_10.csvの10個のファイルを読み込み結果を次々と表に追加したいと思っています。
やったこと
そこで,下記のようにコードを書いて実行してみました。
python
1import glob 2import pandas as pd 3df=pd.DataFrame() 4start= pd.read_csv('/Users/file_1.csv',encoding="cp932", sep=",") 5#start: 6#0 年 A B C D E 7#1 2019_1 1.2 2,3 4.1 2.1 1.1 8file=glob.glob('/Users/*')#ファイル内にあるすべてのcsvファイルを読み込む(ここではfile_1~file_10) 9for i in file: 10 file1=str(i) 11 csv_input = pd.read_csv(file1,encoding="cp932", sep=",") 12 df=pd.concat([start,csv_input])#最初に作ったデータフレームstartにfile1~file10を追加したい 13 df.set_index('年',inplace=True) 14 df.drop('2019_1',inplace=True)#最後に最初に作ったfail_1の行を削除して終了する。 15 16#結果 17#年 A B C D E 18#2019_10 2.1 2.1 2.3 4.1 3.1
結果として一番最後のファイルしか読み込まれていない形になってしまいました。
求めたい結果は
年 A B C D E
2019_1 1.2 2,3 4.1 2.1 1.1
2019_2 2.1 3.4 1.1 2.2 1.1
.
.
.
2019_10 2.1 2.1 2.3 4.1 3.1
ような形でCSVファイルを読み込み、すでにあるデータフレームに追加したいと考えております。
ご教示のほどよろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/01/22 13:53