Python3で機械学習を行う　コードの解釈

#前提・実現したこと
下記のURLのサイトを参考にPython3で機械学習をしたいと考えております。
Webデータレポート生活音を機械学習してみた

最終的には、SVMでwavファイルの判別を行いたいと考えています。

#発生している問題・メッセージ
MFCCのコードまではなんとか実行致しました。しかし、
「▼SVMで判別」のところから雲行きが怪しくなり、

FileNotFoundError: [Errno 2] No such file or directory: 'learning_sample/1_7_5.wav'

というエラーが発生いたしました。使用したコードを以下に記載します。コード後にエラーメッセージ全文を記載いたします。

#コード

if
1    
2    bell_nums = list(range(1,6))
3    pairs = list(itertools.combinations(bell_nums,2))
4    
5    for pair in pairs:
6        
7        bell_num1=int(pair[0])
8        bell_num2=int(pair[1])
9        train_data = np.empty((0,12),float)
10        train_label = np.array([])
11        test_data = np.empty((0,12),float)
12        test_label = np.array([])
13        noise_nums = list(range(1,12))
14        level_nums = list(range(0,10))
15        random.shuffle(noise_nums)
16        
17        nfft = 2048  # FFTのサンプル数
18        nceps = 12   # MFCCの次元数
19        
20        #鈴の音1
21        for noise_num in noise_nums[0:10]:
22            random.shuffle(level_nums)
23            #学習用データを作成
24            for level_num in level_nums[0:10]:
25                files_name = glob.glob("learning_sample/%d_%d_%d.wav" % (bell_num1,noise_num,level_num))
26                for file_name in files_name:
27                    feature = get_feature(file_name,nfft,nceps)
28                    if len(train_data) == 0:
29                        train_data=feature
30                    else:
31                        train_data=np.vstack((train_data,feature))
32                    train_label=np.append(train_label,bell_num1)
33            #テストデータを作成
34            file_name = "learning_sample/%d_%d_%d.wav" % (bell_num1,noise_num,level_nums[8])
35            feature = get_feature(file_name,nfft,nceps)
36            if len(test_data) == 0:
37                test_data=feature
38            else:
39                test_data=np.vstack((test_data,feature))
40            test_label=np.append(test_label,bell_num1)
41    
42        #鈴の音2
43        for noise_num in noise_nums[0:10]:
44            random.shuffle(level_nums)
45            #学習用データを作成
46            for level_num in level_nums[0:10]:
47                files_name = glob.glob("learning_sample/%d_%d_%d.wav" % (bell_num2,noise_num,level_num))
48                for file_name in files_name:
49                    feature = get_feature(file_name,nfft,nceps)
50                    if len(train_data) == 0:
51                        train_data=feature
52                    else:
53                        train_data=np.vstack((train_data,feature))
54                    train_label=np.append(train_label,bell_num2)
55            #テストデータを作成
56            file_name = "learning_sample/%d_%d_%d.wav" % (bell_num2,noise_num,level_nums[8])
57            feature = get_feature(file_name,nfft,nceps)
58            if len(test_data) == 0:
59                test_data=feature
60            else:
61                test_data=np.vstack((test_data,feature))
62            test_label=np.append(test_label,bell_num2)
63            
64    
65        #特徴データをテキストに出力
66        feature_train_data=np.hstack((train_label.reshape(len(train_label),1),train_data))
67        feature_test_data=np.hstack((test_label.reshape(len(test_label),1),test_data))
68        with open("feature_data/train_data.txt","w") as f:
69            writer=csv.writer(f)
70            writer.writerows(feature_train_data)
71        with open("feature_data/test_data.txt","w") as f:
72            writer=csv.writer(f)
73            writer.writerows(feature_test_data)
74                
75        #識別機学習
76        clf = svm.SVC()
77        clf.fit(train_data,train_label)
78        #推定
79        test_pred = clf.predict(test_data)
80        #print np.hstack((test_label.reshape(len(test_label),1),(test_pred.reshape(len(test_pred),1))))
81        
82        #結果算出
83        score=accuracy_score(test_label, test_pred)
84        print (pair,score)

#エラーメッセージ

FileNotFoundError
1<ipython-input-14-bb17746e779f> in <module>
2     34             #テストデータを作成
3     35             file_name = "learning_sample/%d_%d_%d.wav" % (bell_num1,noise_num,level_nums[8])
4---> 36             feature = get_feature(file_name,nfft,nceps)
5     37             if len(test_data) == 0:
6     38                 test_data=feature
7
8~/Desktop/experiment/mfcc.py in get_feature(wavfile, nfft, nceps)
9    128 def get_feature(wavfile,nfft,nceps):
10    129     # 音声をロード
11--> 130     wav, fs = wavread(wavfile)
12    131     t = np.arange(0, len(wav)  /fs, 1/fs)
13    132 
14
15~/Desktop/experiment/mfcc.py in wavread(filename)
16     27 
17     28 def wavread(filename):
18---> 29     wf = wave.open(filename, "r")
19     30     fs = wf.getframerate()
20     31     x = wf.readframes(wf.getnframes())
21
22~/.pyenv/versions/3.6.5/lib/python3.6/wave.py in open(f, mode)
23    497             mode = 'rb'
24    498     if mode in ('r', 'rb'):
25--> 499         return Wave_read(f)
26    500     elif mode in ('w', 'wb'):
27    501         return Wave_write(f)
28
29~/.pyenv/versions/3.6.5/lib/python3.6/wave.py in __init__(self, f)
30    157         self._i_opened_the_file = None
31    158         if isinstance(f, str):
32--> 159             f = builtins.open(f, 'rb')
33    160             self._i_opened_the_file = f
34    161         # else, assume it is an open file object already
35
36FileNotFoundError: [Errno 2] No such file or directory: 'learning_sample/1_7_5.wav'

#試したこと・自分の考え
当初、私はこのコードが「bell(1-5).wav」「noise(1-11).wav」「level(0-9).wav」というwavファイルを作業ディレクトリ上に用意しとけば、学習データを自動で生成してくれるものだと考えておりました。しかし、上記のようなエラーが発生したためそうではないことがわかりました。まだ完璧にこのコードを理解していないので、断言はできませんが、このコードにはあらかじめ「bell(1-5).wav」「noise(1-11).wav」「level(0-9).wav」を合成した、「learning_sample/a_b_c.wav」というwavファイルが必要ではないか、と私は考えたのですが、エラーに対する私のコードの解釈はあっておりますでしょうか？（a、b、cにはそれぞれの数字が入ります）

行動規範の内容に同意します

回答2件

参考サイトを見たところ下記の記述がありました。
見落とされていませんか？

5種類のスズの音に11種類のノイズを加えてデータを作成します。

さらに，ノイズの音量を10段階に設定することで更に多くの音声パターンを生成できる（5 × 11 × 10 = 550種類）。
今回はSoX (Sound eXchange) を使って，以下の手順でスズの音とノイズをミックスしていきます。
(参考：http://qiita.com/mountcedar/items/a04ebc4f8c27c226bbff)

ノイズ入りデータ作成手順 1. すべての音声データを一旦.wav形式に変換する 2. 5種類のスズの音を正規化 3. 11種類のノイズの音を正規化 4. 手順1と手順2からできた音声データをスズの音の長さに合わせて合成する。その際, 新たに合成したノイズ入りのアウトプットファイルをスズの種類ノイズの種類音の段階(0~9).wav として保存する。

例：suzu03のwavファイルとnoise07のwavファイルを合成する。

$ sox -m suzu/suzu03.wav -v 0.2 noise/noise07.wav learning_sample/3_7_9.wav trim 0 suzu03_len
-m : --combine mixの略で2つのファイルを結合するためのオプション。
-v : 後ろの音ファイルの音量を調節をするオプション。(1より大:音量を上げる、1より小:音量を下げる)
trim : 音声を切り取るオプション。例では0秒目からsuzu03の音の長さ(suzu03_len)に合わせてクリッピングしている。

投稿2020/05/20 01:59

meg_

総合スコア10898

maguro2020

2020/05/20 07:19

ご回答いただきありがとうございます。meg様。 meg様にご指摘いただいた記述の場所は自分も何度か目を通しておりました。ただ、参考サイトに「音の種類は全ての組み合わせで550種類（5×11×10）できます」という記述から、てっきり私は、「この参考サイトを書いた人はいちいちコマンドを入力して550種類を作るのではなく、音の素材さえ置いておけば自動生成するプログラムを書いてるのではないか？」と勝手な解釈をしておりました。しかし、コードの解読を進めていくうちに「あれ？このコードだとlearning_sample/a_b_c.wavファイルが必要になるのではないか？」と考えるようになり、meg様やx98000様のご指摘の通り、learning_sample/a_b_c.wavファイルを自分で作成する必要があることがわかりました。自分の知識不足でご迷惑をおかけ致しました。

行動規範の内容に同意します