質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3163閲覧

Pythonによる類似楽曲検索システムについてのエラー解決

gopan

総合スコア19

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2016/11/17 23:35

###前提・実現したいこと
私は「人工知能に関する断創録」というサイトの「類似楽曲検索システムを作ろう」のページにて類似楽曲検索システムの再現を試みているのですが、mfccファイルをsignatureファイルに変換する過程で以下のようなエラーが起きてしまいました。自分はpythonに関してはあまり詳しくないので、このエラーの解決方法が分かりません。どうかよろしくお願い致します。

###発生している問題・エラーメッセージ

λ python mfcc_to_sig.py mfcc sig mfcc\曲名.mfc => sig\曲名.sig Traceback (most recent call last): File "mfcc_to_sig.py", line 59, in <module> mfcc = loadMFCC(mfccFile, 20) File "mfcc_to_sig.py", line 19, in loadMFCC val = struct.unpack("f", b)[0] struct.error: unpack requires a bytes object of length 4

###該当のソースコード

Python

1#coding:utf-8 2import os 3import struct 4import sys 5import numpy as np 6import scipy.cluster 7 8# mfcc_to_signature.py 9# usage: python mfcc_to_signature.py [mfccdir] [sigdir] 10# 各曲のMFCCをシグネチャに変換する 11 12def loadMFCC(mfccFile, m): 13 """MFCCをロードする、mはMFCCの次元数""" 14 mfcc = [] 15 fp = open(mfccFile, "rb") 16 while True: 17 b = fp.read(4) 18 if b == "": break 19 val = struct.unpack("f", b)[0] 20 mfcc.append(val) 21 fp.close() 22 23 # 各行がフレームのMFCC 24 # numFrame行、m列の行列形式に変換 25 mfcc = np.array(mfcc) 26 numFrame = len(mfcc) / m 27 mfcc = mfcc.reshape(numFrame, m) 28 29 return mfcc 30 31def vq(mfcc, k): 32 """mfccのベクトル集合をk個のクラスタにベクトル量子化""" 33 codebook, destortion = scipy.cluster.vq.kmeans(mfcc, k) 34 code, dist = scipy.cluster.vq.vq(mfcc, codebook) 35 return code 36 37if __name__ == "__main__": 38 if len(sys.argv) != 3: 39 print "usage: python mfcc_to_signature.py [mfccdir] [sigdir]" 40 sys.exit() 41 42 mfccDir = sys.argv[1] 43 sigDir = sys.argv[2] 44 45 if not os.path.exists(sigDir): 46 os.mkdir(sigDir) 47 48 for file in os.listdir(mfccDir): 49 if not file.endswith(".mfc"): continue 50 mfccFile = os.path.join(mfccDir, file) 51 sigFile = os.path.join(sigDir, file.replace(".mfc", ".sig")) 52 53 print mfccFile, "=>", sigFile 54 55 fout = open(sigFile, "w") 56 57 # MFCCをロード 58 # 各行がフレームのMFCCベクトル 59 mfcc = loadMFCC(mfccFile, 20) 60 61 # MFCCをベクトル量子化してコードを求める 62 code = vq(mfcc, 16) 63 64 # 各クラスタのデータ数、平均ベクトル、 65 # 共分散行列を求めてシグネチャとする 66 for k in range(16): 67 # クラスタkのフレームのみ抽出 68 frames = np.array([mfcc[i] for i in range(len(mfcc)) if code[i] == k]) 69 # MFCCの各次元の平均をとって平均ベクトルを求める 70 m = np.apply_along_axis(np.mean, 0, frames) # 0は縦方向 71 # MFCCの各次元間での分散・共分散行列を求める 72 sigma = np.cov(frames.T) 73 # 重み(各クラスタのデータ数) 74 w = len(frames) 75 # このクラスタの特徴量をフラット形式で出力 76 # 1行が重み1個、平均ベクトル20個、分散・共分散行列400個の計421個の数値列 77 features = np.hstack((w, m, sigma.flatten())) 78 features = [str(x) for x in features] 79 fout.write(" ".join(features) + "\n") 80 fout.close()

###補足情報(言語/FW/ツール等のバージョンなど)
OS : Windows10
Python : Python 3.5.2 |Anaconda 4.2.0 (64-bit)|
(Anaconda3でpython環境を整えました)
コンソール : cmder
エディター : VScode

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

4バイト読み込もうとしているのに、それ未満のデータしか読み込めなかった(途中で途切れている)可能性があります。
読込元のMFCCファイルの中身が正しいかを確認ください。
参考サイトにMFCCファイルをダンプ出力するスクリプトprint_mfcc.pyがあるので確認できます。

投稿2016/11/18 01:19

can110

総合スコア38234

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gopan

2016/11/18 01:44

print_mfcc.pyを実行したのですが、質問時と同じように以下のようなエラーが出てしまいました。 「struct.error: unpack requires a bytes object of length 4」 手順も参考サイトと同じようにしたはずなのですが、なぜmfccファイルはそのようなデータになってしまったのでしょうか? どうかよろしくお願いします。
gopan

2016/11/18 01:53

連投すみません。 CygwinにインストールされているPython2.7でprint_mfcc.pyを実行してみたところ、問題なくダンプすることができました。 この場合、Anaconda3のPython環境の方ががおかしいということになるのでしょうか? ちなみにいずれも同じPCを使用しています。 よろしくお願いします。
can110

2016/11/18 02:22

今確認できないのですが b = fp.read(4)の戻り値の型がpython2.xと3.xで異なる可能性があります。 print( type(b))を追加してAnaconda3環境で実行して'float'と表示されるなら struct.unpack不要なので元スクリプトの修正が必要になります。
can110

2016/11/18 04:34

確認しました。readの戻り値の型が変わっていますね。2.xは'str'、3.xは'byte' よって if b == "": break の判定はまずいです。 if len(b) < 4: break なりに修正する必要があります。 現実的には修正大変なので2.x環境で動作させる方がよいでしょう。
gopan

2016/11/22 03:57

色々と丁寧に教えていただき、ありがとうございました! 無事にできました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問