WAVファイルをkmeans法で分類したい

Question

### 前提
用いているプログラミング言語：python
データセット：https://github.com/karolpiczak/ESC-50
参考にしているサイト：https://magazine.techacademy.jp/magazine/28780

音声処理初心者で、プログラミングが苦手な学生です。いろいろ調べて行っているのですが、中々答えにたどり着けずにいます。

私と同じようなことを行っているサイトがありましたら教えていただけますでしょうか。
WAVファイルをkmeans法で分類したことのある方がいらっしゃいましたら教えていただきたいです。

### 実現したいこと

・音声ファイルをkmeans法で分類したい
・”mix.wav”はESC-50-masterの中の音声データ2つを重ね合わせたもの

### 発生している問題・エラーメッセージ
・前処理の段階でエラーが出てしまう

エラーメッセージ
AttributeError                            Traceback (most recent call last)
Cell In[4], line 3
      1 with wave.open(FILE_PATH ,  'rb') as wr:
      2     #前処理
----> 3     dataframe = pd.read_wav('FILE_PATH')
      4    # df = pd.DataFrame(data=FILE_PATH)
      5     print(df.head())

File ~\AppData\Local\Programs\Python\Python311\Lib\site-packages\pandas\__init__.py:264, in __getattr__(name)
    260     from pandas.core.arrays.sparse import SparseArray as _SparseArray
    262     return _SparseArray
--> 264 raise AttributeError(f"module 'pandas' has no attribute '{name}'")

AttributeError: module 'pandas' has no attribute 'read_wav'

### 該当のソースコード

```python
from matplotlib import pyplot as plt
from sklearn import datasets, preprocessing
from sklearn.cluster import KMeans
import numpy as np 
import pandas as pd
import wave

#データの読み込み
#wav=open("./ESC-50-master/audio/mix.wav")
#sample = wav.load()

# 読み込みモードでWAVファイルを開く
FILE_PATH = "./ESC-50-master/audio/mix.wav"

with wave.open(FILE_PATH ,  'rb') as wr:
    #前処理
    dataframe = pd.read_wav('FILE_PATH')
   # df = pd.DataFrame(data=FILE_PATH)
    print(df.head())

#クラスタリング用のデータの整形
    X=df[["cat","sheep"]]
    sc = preprocessing.StandardScaler()
    sc.fit(X)
    X_norm = sc.transform(X)
    print(type(X_norm))

#クラスタリング
    cls = KMeans(n_clusters=2)
    result = cls.fit(X_norm)

#結果の出力
    plt.scatter(X_norm[:,0],X_norm[:,1], c=result.labels_)
    plt.scatter(result.cluster_centers_[:,0],result.cluster_centers_[:,1],s=250, marker='*',c='red')
    plt.show()
```

### 試したこと
・WAVファイルはpandasでは開けないのかと考え、WAVファイルをpandasが読み込めるファイルに変換しようと考えたができなかった。

・pandasを用いない前処理も探したが見つけることが出来なかった
・mix.wav　をスペクトログラム変換したのだが、これは前処理が終わったとは言えない…？

・WAVファイルをｋmeans法で分類しているサイトを探したが出てこなかった（CNNを用いているものばかりだった）

### 補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

Accepted Answer

> WAVファイルはpandasでは開けないのかと考え、WAVファイルをpandasが読み込めるファイルに変換しようと考えたができなかった。
Pandasには非構造化データを読み取る機能はありません．[Pandas - input/output](https://pandas.pydata.org/docs/reference/io.html)

> pandasを用いない前処理も探したが見つけることが出来なかった
[NumPy](https://numpy.org/doc/stable/reference/generated/numpy.fft.fft.html)や[SciPy](https://docs.scipy.org/doc/scipy/reference/signal.html)などのライブラリでFFTをはじめとする前処理が可能です．

> mix.wav　をスペクトログラム変換したのだが、これは前処理が終わったとは言えない…？
質問掲載コードのどこでもスペクトログラム変換が実行されていません．

> WAVファイルをｋmeans法で分類しているサイトを探したが出てこなかった（CNNを用いているものばかりだった）
そもそも論，非構造化データをk-Means法で分類することの影響/効果を理解されての質問でしょうか．
[RightCode - 【機械学習】ブログのサムネ画像をクラスタリングしてみる！](https://rightcode.co.jp/blog/information-technology/machine-learning-image-clustering)
このサイトでも示されている通り，wavファイルのデータそのものに対してk-Meansを純粋に適用するだけでは，聴覚的(上記サイトでは視覚的)な特徴で分類することにはなりません．多次元配列のindex-wiseな比較がされて分類されることを許容するのなら話は別です．

### 追記
ESC-50を使った`dog`と`cat`のk-Means法によるクラスタリング例及びt-SNEを利用した可視化を次に示します．

```Python
import os
import wave
from matplotlib import pyplot as plt
from sklearn import preprocessing
from sklearn.cluster import KMeans
from sklearn.manifold import TSNE
import numpy as np 
import pandas as pd

df = pd.read_csv("ESC-50-master/meta/esc50.csv")
data = df[(df["category"] == "dog") | (df["category"] == "cat")][["filename", "category"]].values

X, y = list(), list()
for i, (file, category) in enumerate(data):
    with wave.open(os.path.join("./ESC-50-master", "audio", file), "r") as f:
        buf = f.readframes(1024)
        X.append(np.frombuffer(buf, np.int16))
        y.append(category)

cls = KMeans(n_clusters = 2).fit(X)
reduced = TSNE(n_components = 2).fit_transform(X)

plt.figure(figsize = (8, 4), dpi = 100)
plt.scatter(reduced[:, 0], reduced[:, 1], c = cls.labels_)
for i in range(len(y)):
    plt.annotate(y[i], xy = (reduced[i][0], reduced[i][1]))
plt.savefig("output.png", dpi = 100)
plt.tight_layout()
plt.show()
```

![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-01-16/a13bba6a-f81b-4b71-9c9e-c5905ab66f22.png)

2クラスタとなるよう`n_clusters`を指定したものの，`cat`のうち1つ(画面左端の黄点)が分離されるだけでほとんど同一クラスタと見なされました．

前提

実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

追記

関連した質問