編集履歴

回答編集履歴

修正

2017/11/13 16:05

投稿

スコア8562

answer CHANGED Viewed

@@ -9,4 +9,64 @@
 ```
 キーの意味を知りたければ、以下を参考に。
-http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
+http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
+---
+追記:
+コメントの内容を全部まとめてコードを書き直すと、以下の通り。
+走らせる環境がないので、タイプミス・インデントミスがあるかもしれません。あしからず。
+```python
+# coding:utf-8
+from sklearn import svm, cross_validation
+from sklearn.metrics import classification_report, accuracy_score
+import sys
+from mfcc import *
+import glob
+import csv
+import random
+import numpy as np
+import os
+from sklearn.model_selection import train_test_split
+def get_data(files, nfft, nceps):
+    data = None
+    label = np.array([])
+    for file_name in files:
+        feature = get_feature(file_name, nfft, nceps)
+        if data is None:
+            data = feature
+        else:
+            data = np.vstack((data, feature))
+        if file_name.split('/')[-1].startswith('dog'):
+            label = np.append(label, 0)
+        else:
+            label = np.append(label, 1)
+    return data, label
+if __name__ == "__main__":
+    nfft = 2048  # FFTのサンプル数
+    nceps = 12  # MFCCの次元数
+    basedir = '/sound_animal/sounds'
+    files = glob.glob(os.path.join(basedir, '*.wav'))
+    data, label = get_data(files, nfft, nceps)
+    train_data, test_data, train_label, test_label = train_test_split(data, label, test_size=0.33, random_state=0, stratify=label)
+    feature_train_data = np.hstack((train_label.reshape(-1, 1), train_data))
+    feature_test_data = np.hstack((test_label.reshape(-1, 1), test_data))
+    with open("feature_data/train_data.txt", "w") as f:
+        writer = csv.writer(f)
+        writer.writerows(feature_train_data)
+    with open("feature_data/test_data.txt", "w") as f:
+        writer = csv.writer(f)
+        writer.writerows(feature_test_data)
+    clf = svm.SVC(kernel='linear', C=1)
+    clf.fit(train_data, train_label)
+    score = clf.score(test_data, test_label)
+    print(score)
+```