あるフォルダ内にある複数のcsvファイル(すべて8列101行)の時系列データがあり,各csvの同じセルごとに平均値や標準偏差を求めたcsvファイル(8列101行)を新たに作成したいと考えております.
現在下記のように作成してみたのですが,うまく行きません.
for file in files: if not (file.endswith('.CSV') or file.endswith('.csv')): print('skip') continue #print(file) test = pd.read_csv(file, header = None, engine="python") #print(test) np_test = test.values # print(np_test) # print(np.mean(np_test, axis=0))
print(np_test)では複数ファイル配列が確認できました(途中省略).
out [[ 3.81 116.42110744 11.55506717 87.43426536 60.41401039 10.03996679 67.39556258 -32.09862578] [ 3.820 116.8401092 13.15872423 87.95743445 59.88379927 10.98897601 68.90879969 -31.46598334] [ 3.8318 117.01302526 15.05095255 88.86546004 59.70175505 12.59007358 70.73742085 -30.48703647] [ 3.8427 117.2006565 17.11245664 89.83292112 59.69748579 14.47461612 72.89325515 -29.42341489] [ 3.8536 117.24206081 19.26860941 90.89479143 60.00357283 16.89246718 75.33878428 -28.21231344] #以下省略,ファイルの数に応じて増える
これを要素ごとに平均したり標準偏差を求めたりしたものをcsvとして書きだせば良いかと思ったのですが,print(np..mean(np_test, axis=0))で確認すると下記のように出力されます.
out [ 4.355 96.70872455 36.65559909 84.26374545 92.88908455 32.37911545 78.45936364 -1.35645405]
内容の確認,teratailでの類似質問の検索をしてみましたが,探し方が悪いためか解決の糸口がつかめない状態です.
まだ使い始めたばかりでわからない点も多々あるのですが,教えていただければ幸いです.
何卒よろしくお願いいたします.
回答2件
あなたの回答
tips
プレビュー