python　csvの出力

４列目（風向）で欠損NaNのある行を削除し、新規csvを出力させたいのですが出力がうまくいきません。
（エラーもなく、新規csvも生成されない）
GMTフォルダ内にある
test_0200.csv
test_0300.csv
test_0400.csv
test_0500.csv
...
と続くcsvを実行させ、それぞれ0200.csv、0300.csv、0400.csvといった形で出力させたいです。

csv内容

       0         1           2  3    4    5   6
0   1  14101010  2019/08/01  2  WSW  1.5 NaN
1   1  14101020  2019/08/01  2  WSW  1.2 NaN
2   1  14101520  2019/08/01  2  NaN  NaN NaN
3   1  14102010  2019/08/01  2    W  1.3 NaN
4   1  14103010  2019/08/01  2  WSW  1.4 NaN
.. ..       ...         ... ..  ...  ...  ..
91  1  14401010  2019/08/01  2  NaN  NaN NaN
92  1  14104030  2019/08/01  1  WSW  1.9 NaN
93  1  14102010  2019/08/01  1   SW  1.5 NaN
94  1  14102010  2019/08/01  1   SW  1.5 NaN
95  1  14101520  2019/08/01  1  NaN  NaN NaN

試したこと

import pandas as pd
import glob
import re


for f in glob.glob('GMT/*.csv'):
    df = pd.read_csv(f, header=None)
    
    df.dropna(subset=[4], inplace=True)

    m = re.search('_(\d + csv)', f)
    
    df.to_csv(m.group(), header=False, index=False)

meg_

2020/07/26 07:09

「出力がうまくいきません。」とありますが、どううまくいかなかったのでしょうか？

o-fk

2020/07/26 07:10

新規csvが生成されないという意味です。

meg_

2020/07/26 07:21

「新規csvが生成されないという意味です。」とは具体的にどういうことでしょうか？（エラーが発生して出力されない？ファイルが上書きされている？　エラーもないが保存もされない？？）また、具体的な状況については質問に追記してください。

meg_

2020/07/26 07:51

> （エラーもなく、新規csvも生成されない）そうですが。エラーは出ませんか。私の環境（Windows）で試したところ、df.to_csvの行でエラーが出ました。環境の違いでしょうか？　力になれないようです。

o-fk

2020/07/26 07:52

すみません。ありがとうございました。

行動規範の内容に同意します

回答1件

ベストアンサー

(いままでの質問でも画像だったりしてできていませんでしたが)実際に使っているCSVファイルをそのまま提示してください。長ければ先頭10行などだけでもいいので。毎回、「元のCSVファイルはこんなやつかな」と回答者に作成させる手間をかけさせていますよ。

さて、今回の質問で使っているCSVファイルは、おそらくこんなやつです(途中省略されている部分を除く)。提示されているデータは、おそらくそれをpandasで読みこんで、indexを付けて表示したものでしょう。そんなことしないで、そのまま提示してくれたほうが10倍ぐらい回答が付きやすいと思います。

CSV
11,14101010,2019/08/01,2,WSW,1.5,
21,14101020,2019/08/01,2,WSW,1.2,
31,14101520,2019/08/01,2,,,
41,14102010,2019/08/01,2,W,1.3,
51,14103010,2019/08/01,2,WSW,1.4,
61,14401010,2019/08/01,2,,,
71,14104030,2019/08/01,1,WSW,1.9,
81,14102010,2019/08/01,1,SW,1.5,
91,14102010,2019/08/01,1,SW,1.5,
101,14101520,2019/08/01,1,,,

今回のプログラムの問題点

途中で書き替えたデータフレームdfの内容を確認しようとしているが、dropnaの返り値を表示してもdfの内容は表示されない。
正規表現では.そのものにマッチさせるには.と書かないといけない。.では任意の1文字にマッチしてしまう。
searchの返り値はマッチオブジェクトで、マッチした文字列そのものではない。m.group()でマッチした文字列を取得する。

Python
1import pandas as pd
2import glob
3import re
4
5
6for f in glob.glob('GMT/*.csv'):
7    df = pd.read_csv(f, header=None)
8    df.columns = ['A', 'B', 'C', 'D', 'E', 'F', 'G']
9
10    df.dropna(subset=['E'], inplace=True)
11    print(df)
12
13    m = re.search('\d+.csv', f)
14    #print(m.group())
15    df.to_csv(m.group(), header=False, index=False)