質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.57%

MicrosoftのSpeakerRecognitionをPythonから叩きたい!

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 804

jajauma007

score 13

SpeakerRecognitionAPIで、Identification Profileの設定までは完了。

あとは話者識別してほしい音声ファイルを送るだけだと思っているのですが、、、

import http.client, urllib.request, urllib.parse, urllib.error, base64

headers = {
    # Request headers
    'Content-Type': 'application/octet-stream',
    'Ocp-Apim-Subscription-Key': '...........',
}

params = urllib.parse.urlencode({
    # Request parameters
    'shortAudio': 'true',
})

try:
    conn = http.client.HTTPSConnection('westus.api.cognitive.microsoft.com')
    conn.request("POST", "/spid/v1.0/identify?identificationProfileIds=........&%s" % params, "*********", headers)
    response = conn.getresponse()
    data = response.read()
    print(data)
    conn.close()
except Exception as e:
    print("[Errno {0}] {1}".format(e.errno, e.strerror))


上記のサンプルコードを公式HPから真似して送信したところエラーが発生しました。

b'{\r\n  "error": {\r\n    "code": "BadRequest",\r\n    "message": "Invalid Audio Format: Not a WAVE file - no RIFF header"\r\n  }\r\n}'


音声ファイルは学習用に送信したものと同じ設定(wav,16bits,16kHz)で自分で録音しました。
イメージ説明

また、*******のところは自分のPC上の音声ファイルへのPATHを書いたのですが、合っているでしょうか?

<追記>
curlを使ってもPOST通信を試してみました。

curl -v -X POST "https://api.projectoxford.ai/spid/v1.0/identify?identificationProfileIds=****?shortAudio=true" -H "Content-Type: application/octet-stream" -H "Ocp-Apim-Subscription-Key: ****” --data-ascii @/Downloads/dictation-kit-v4.4/waveFiles/sample.wav


しかし、こちらではまた違うエラーが発生しています。。。

{
  "error": {
    "code": "BadRequest",
    "message": "Guid should contain 32 digits with 4 dashes (xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)."
  }


もちろんGuidは入力して送っています。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • quickquip

    2018/10/15 17:59

    メッセージ読んでます?

    キャンセル

  • jajauma007

    2018/10/15 18:13

    再編集で掲載した画像の通り、wavファイルで録音されているのですがあのメッセージが出てきます。

    キャンセル

  • t_obara

    2018/10/15 19:37

    MSのサンプルがわかりにくいですね。binaryデータを送付しろとなっているのに、curlのサンプルがdata-asciiってなんの冗談なんだろうか。それはさておき、最初のエラーではフォーマットが想定と違うとの指摘ですが、それを理解した上でどの様な対応をしたのでしょうか?

    キャンセル

  • jajauma007

    2018/10/15 19:58

    curlについてはネットで調べて落ちていたソースを使っています。MSのサンプルではありません。紛らわしい記述ですみませんでした。最初のエラーについてはPATHの再確認とwaveファイルの長さなどを確認したところです。また、学習段階で送信した音声ファイルを短く編集して送ってもみました。

    キャンセル

回答 1

0

また、*******のところは自分のPC上の音声ファイルへのPATHを書いたのですが、合っているでしょうか?

たぶん間違っています。

"message": "Invalid Audio Format: Not a WAVE file - no RIFF header" · Issue #3 · Microsoft/Cognitive-SpeakerRecognition-Android · GitHub

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.57%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る