フォルダ内のcsvすべてに同じ処理をしたいです．

Question

```
import cv2
import numpy as np
import matplotlib.pyplot as plt
import csv
import glob
import pandas as pd

infile = glob.glob("UP/*.csv")
infile.sort()
inum = len(infile)
print('csvファイル数', inum)

t = np.arange(0,8.192,0.0005) #サンプリング時間,周波数の指定(開始時間(=0),終了時間,サンプリング周期)

def fft(infile, outfile):
 
 for j in range(inum):
     file = infile[j]

  ##### データの読み込み #####
     for i in range(4):
         print(i)
         def loadvtp(file,i):  #ファイルの読み込みに使用する関数の定義file+'.csv'
             vtp = pd.read_csv(file, dtype='float', skiprows=57, usecols=[i+2], nrows=16384, engine='python', header=None)   #解析対象となるデータの読み込み
             vtp = vtp - np.mean(vtp)   #平均を引く
             vtp = np.squeeze(vtp)
             return vtp

    ##### 主流(x)成分出力の計算 #####

         vx = loadvtp(file,i)
 
    ##### FFT #####

         freq = np.fft.fftfreq(16384, 1/2000) #周波数軸の生成(サンプリング点数, サンプリング周期)

         f = np.fft.fft(vx) #FFT
         f [0]=f[0]/2 #定常成分を1/2にする(スケーリングに必要)
         amp = np.abs(f)/(16384/2) #FFT結果を振幅に合わせてスケーリング

         freq = freq[0:16384//2] #周波数軸の対称成分を除く
         amp = amp[0:16384//2] #振幅の対称成分を除く

         if i==0:
            yav=vx
            xav=""
            vav=""
            wav=""
            y=amp
            x=""
            v=""
            w=""
         elif i==1:
            yav=yav
            xav=vx
            vav=""
            wav=""
            y=y
            x=amp
            v=""
            w=""
         elif i==2:
            yav=yav
            xav=xav
            vav=vx
            wav=""
            y=y
            x=x
            v=amp
            w=""
         elif i==3:
            yav=yav
            xav=xav
            vav=vav
            wav=vx
            y=y
            x=x
            v=v
            w=amp
 
         print(y)
         print(x)
         print(v)
         print(w)
 
         df = [t, yav, xav, vav, wav, freq, y, x, v, w]
         df=pd.DataFrame(df).T
         df.to_csv('FFT.csv', index=None)

```

フォルダ内のcsvファイル1つ1つにfftをかけ，同一のcsv（FFT.csv）にすべて保存したいです．
しかし，
     for i in range(4):
からうまく動作していないようです．エラーは出ないのですが，FFT.csv自体作成されません．

最初，def fft(infile, outfile):
という関数をつくらずに単一のcsvファイルでfftがうまくできるのかを試したところうまくいったので，fft事態に誤りはありません．

どのように改良すればいいでしょうか？

結果のコードを一応示します．
```
csvファイル数 37
```

Accepted Answer

そもそも、関数を定義しているだけで呼んでいないので、何も起きないのは当然です。

---

[この件はこの質問](https://teratail.com/questions/344591)あたりから続いているんだと思います。ここから関数化して進めているのでしょうが、その関数の中でいろいろ入れ込んでしまうのは筋が悪いですから、そこに戻って進めます。

## まずは関数化と動作確認

もとのファイルでcsvをFFTする処理はできているということなので、まずはこの処理を関数に入れてみましょう。
そして、ここが大事ですが、この段階でもとのファイルと同じように動作するようにします。これができなれけば先に進むことはできません。

さて、関数にするにあたっては、処理そのものを全部関数にするのではなくて、最後のcsvへの書き出しは関数の外に出します。この部分は後で変更したいからです。
関数名はfftだと他の紛らわしいので、my_fftとしました。
作る関数の引数は読み込むcsvファイルの名前にします。

csvに出力しないとしたら、作成したデータ、この場合はdfですね、はどうするのかというと、関数の返り値にします。
この関数は、csvファイルを引数にして呼び出すと、FFTの結果を返す関数だということです。

関数ができれば、関数にした処理をちゃんと呼び出すのを忘れてはいけません。関数は定義しただけでは動作しません。
関数を呼び出すときは、定義の通り、CSVファイルを1つ指定します。 返り値でFFTの結果が返るので、それを変数で受けて、csvに書き出します。

このように変更したのが以下のソースです。
このソースで想定どおり動作することを確認してみてください。

ちなみに、pythonファイルのインデントは基本的にスペース4つに統一すべきです。
以下のソースでは修正してあります。

※ 以下コード書きますが、手元に情報が無いので、動作の検証まではしていません。バグがあるかもしれませんが悪しからず。

```python
import cv2
import numpy as np
import matplotlib.pyplot as plt
import csv
import os
import glob
import pandas as pd


def my_fft(infile):
    ##### 実験条件、分析対象の設定 ######
    t = np.arange(0,8.192,0.0005) #サンプリング時間,周波数の指定(開始時間(=0),終了時間,サンプリング周期)

    file = infile #分析対象のファイル指定

    ##### データの読み込みy #####
    for i in range(4):
        print(i)
        def loadvtp(file,i):  #ファイルの読み込みに使用する関数の定義
            vtp = pd.read_csv(file+'.csv', dtype='float', skiprows=57, usecols=[i+2], nrows=16384, engine='python', header=None)   #解析対象となるデータの読み込み
            vtp = vtp - np.mean(vtp)   #平均を引く
            vtp  = np.squeeze(vtp)
            return vtp

        ##### 主流(x)成分出力の計算 #####

        vx = loadvtp(file,i)

        ##### FFT #####

        freq = np.fft.fftfreq(16384, 1/2000) #周波数軸の生成(サンプリング点数, サンプリング周期)

        f = np.fft.fft(vx) #FFT
        f [0]=f[0]/2 #定常成分を1/2にする(スケーリングに必要)
        amp = np.abs(f)/(16384/2) #FFT結果を振幅に合わせてスケーリング

        freq = freq[0:16384//2] #周波数軸の対称成分を除く
        amp = amp[0:16384//2] #振幅の対称成分を除く

        if i==0:
            yav=vx
            xav=""
            vav=""
            wav=""
            y=amp
            x=""
            v=""
            w=""
        elif i==1:
            yav=yav
            xav=vx
            vav=""
            wav=""
            y=y
            x=amp
            v=""
            w=""
        elif i==2:
            yav=yav
            xav=xav
            vav=vx
            wav=""
            y=y
            x=x
            v=amp
            w=""
        elif i==3:
            yav=yav
            xav=xav
            vav=vav
            wav=vx
            y=y
            x=x
            v=v
            w=amp

        print(y)
        print(x)
        print(v)
        print(w)

    df = [t, yav, xav, vav, wav, freq, y, x, v, w]
    df=pd.DataFrame(df).T

    return df


## メイン処理
##   1ファイルだけ
##   csv
in_csv_file = '0.73'
fft_df = my_fft(in_csv_file)
fft_df.to_csv('FFT.csv', index=None)

```

上のソースで動作確認できたでしょうか？できていなければ次に進んでも意味がありません。

## 複数ファイル処理。まだ出力はCSV

次に、フォルダの中のファイルを全て順に処理するようにしましょう。

すでに、1つのファイルを処理する関数はできているので、それを、取得したファイル名で順に呼びだすだけです。ファイルの出力処理は同じです。
だたし、CSVで出力するときにファイル名が固定のFFT.csvだと、どんどん上書きしてしまうので、読み込んファイルの名前を含むように変えてやります。
ファイル名の取得は質問にあるソースあるglob処理を使いました。globで取ってきたファイル名はパスなので、ファイル名の部分だけ取り出すためにosモジュールを使います。

その様に変更したのが以下のソースです。 
関数の部分は変えていないので割愛で、メイン処理の部分を書き換えます(前のを残しておいてはだめです)
import文は最終的にはファイルの先頭にまとめた方がいいでしょう。

動かしてみると、スクリプトのあるファルダにcsvファイルができているはずです。
できていますか？ そして、中身が想定通りでしょうか？

```python
## メイン処理
##   UPフォルダ内全部
##   個別にcsvに出力
import os

infile = glob.glob("UP/*.csv")
infile.sort()
print('入力csvファイル数', len(infile))

for in_csv_file in infile:
    in_file_name = os.path.basename(in_csv_file)

    fft_df = my_fft(in_csv_file)

    fft_df.to_csv(f'FFT_{in_file_name}.csv', index=None)

```

上のソースで動作確認できたでしょうか？できていなければ次に進んでも意味がありません。

## 最後にExcelににします。

Pandasにはto_excelという関数がありますので、それを使えばいいでしょう。
[このサイトに詳しく説明してあります](https://note.nkmk.me/python-pandas-to-excel/)
そこにも書いてありますが、使うにはopenpyxlが必要になりますので入っていなければインストールしておきます。

複数のDataFrameを1つのブックに入れるので、サイトの最後に書いてある方法でやります。

今度もメイン処理の部分だけ書き換えます(前のを残しておいてはだめです)
それが以下のコードです。

```python
## メイン処理
##   UPフォルダ内全部
##   Excelに出力. ファイル名はFFT.xlsxとしています。
import os

infile = glob.glob("UP/*.csv")
infile.sort()
print('入力csvファイル数', len(infile))

with pd.ExcelWriter('FFT.xlsx', mode='w') as writer:
    for in_csv_file in infile:
        in_file_name = os.path.basename(in_csv_file)

        fft_df = my_fft(in_csv_file)

        fft_df.to_excel(writer, sheet_name=in_file_name)

```



以上ですが、こんな風に、処理の中核部分を関数化してあれば、処理対象や出力方法などはその処理とは関係ないので、見通し良く作っていくことができるのです。
最初の回答の人が関数化と書いたのはこういうことだったのです。

関数化した中の処理についても、さらに関数化するなどして読みやすくすることもできますが置いておきました。
、

まずは関数化と動作確認

複数ファイル処理。まだ出力はCSV

最後にExcelににします。

関連した質問