MicrosoftのSpeakerRecognitionをPythonから叩きたい！

SpeakerRecognitionAPIで、Identification Profileの設定までは完了。

あとは話者識別してほしい音声ファイルを送るだけだと思っているのですが、、、

import http.client, urllib.request, urllib.parse, urllib.error, base64

headers = {
    # Request headers
    'Content-Type': 'application/octet-stream',
    'Ocp-Apim-Subscription-Key': '...........',
}

params = urllib.parse.urlencode({
    # Request parameters
    'shortAudio': 'true',
})

try:
    conn = http.client.HTTPSConnection('westus.api.cognitive.microsoft.com')
    conn.request("POST", "/spid/v1.0/identify?identificationProfileIds=........&%s" % params, "＊＊＊＊＊＊＊＊＊", headers)
    response = conn.getresponse()
    data = response.read()
    print(data)
    conn.close()
except Exception as e:
    print("[Errno {0}] {1}".format(e.errno, e.strerror))

上記のサンプルコードを公式HPから真似して送信したところエラーが発生しました。

error
1b'{\r\n  "error": {\r\n    "code": "BadRequest",\r\n    "message": "Invalid Audio Format: Not a WAVE file - no RIFF header"\r\n  }\r\n}'

音声ファイルは学習用に送信したものと同じ設定（wav,16bits,16kHz）で自分で録音しました。

また、＊＊＊＊＊＊＊のところは自分のPC上の音声ファイルへのPATHを書いたのですが、合っているでしょうか？

＜追記＞
curlを使ってもPOST通信を試してみました。

curl -v -X POST "https://api.projectoxford.ai/spid/v1.0/identify?identificationProfileIds=＊＊＊＊?shortAudio=true" -H "Content-Type: application/octet-stream" -H "Ocp-Apim-Subscription-Key: ＊＊＊＊” --data-ascii @/Downloads/dictation-kit-v4.4/waveFiles/sample.wav

しかし、こちらではまた違うエラーが発生しています。。。

{
  "error": {
    "code": "BadRequest",
    "message": "Guid should contain 32 digits with 4 dashes (xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)."
  }

もちろんGuidは入力して送っています。

quickquip

2018/10/15 08:59

メッセージ読んでます?

退会済みユーザー

2018/10/15 09:13

再編集で掲載した画像の通り、wavファイルで録音されているのですがあのメッセージが出てきます。

t_obara

2018/10/15 10:37

MSのサンプルがわかりにくいですね。binaryデータを送付しろとなっているのに、curlのサンプルがdata-asciiってなんの冗談なんだろうか。それはさておき、最初のエラーではフォーマットが想定と違うとの指摘ですが、それを理解した上でどの様な対応をしたのでしょうか？

退会済みユーザー

2018/10/15 10:58

curlについてはネットで調べて落ちていたソースを使っています。MSのサンプルではありません。紛らわしい記述ですみませんでした。最初のエラーについてはPATHの再確認とwaveファイルの長さなどを確認したところです。また、学習段階で送信した音声ファイルを短く編集して送ってもみました。

行動規範の内容に同意します

回答1件

また、＊＊＊＊＊＊＊のところは自分のPC上の音声ファイルへのPATHを書いたのですが、合っているでしょうか？

たぶん間違っています。

"message": "Invalid Audio Format: Not a WAVE file - no RIFF header" · Issue #3 · Microsoft/Cognitive-SpeakerRecognition-Android · GitHub

投稿2018/10/15 12:08

hayataka2049

総合スコア30939

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問