質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.25%

  • PHP

    15688questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • Linux

    2822questions

    Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

  • API

    1080questions

    APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

  • Google API

    353questions

    Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

  • Google Cloud Platform

    57questions

Google Speech APIで長時間の音声を認識させたい

解決済

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 76

tansen14

score 2

長時間の音声データを一発で認識させたい

私は現在、Google Speech APIを用いて、音声認識のテストを行っています。
無知ながら独自に用意した15秒前後の音声は無事認識に成功することができました。

その際に、下記リンクのquick.phpを利用していました。
https://github.com/GoogleCloudPlatform/php-docs-samples/tree/master/speech

今度は少し長めの音声を認識させてみたかったのですが、
調べたところ非同期通信での認識がいいと書いてあったので
speech.phpを使い、対応することにしました。
しかし、エラーがでて分からなくなってしまったので
解決策を教えてください。

実行とエラーメッセージ

linuxでのコマンドは以下です。

php speech.php transcribe-async resources/sample.wav --encoding LINEAR16 --language-code ja-JP --sample-rate 16000

sample.wavは10分ほどの音声データになります。

[Google\Cloud\Core\Exception\BadRequestException]
  {
    "error": {
      "code": 400,
      "message": "Request payload size exceeds the limit: 10485760 bytes.",
      "status": "INVALID_ARGUMENT"
    }
  }

試したこと

音声を分割してみましたが、1分を超えるとダメみたいです。
使用制限に

"Google Cloud Storage で音声ファイルを参照する場合、1 分よりも長い音声には uri フィールドを使用する必要があります。"

と書いてあったので、こちらが関係してくるのでしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

sample.wav のファイルサイズは、どれぐらいでしょうか?
wav のレートから考えると 約100MB ぐらいでしょうか?

エラーメッセージからすると 直接送信するファイルサイズは、約10MB がリミットのようです。

API 的な制限は、非同期リクエストは、80分とあるので、説明にある通り、ファイルサイズが大きい場合、uri フィールドを使う必要があるのではないでしょうか。

ドキュメント Cloud Speech API の基本 にも 

content にはリクエスト内に埋め込まれた、評価対象の音声が含まれます。詳細については、後述の音声コンテンツの埋め込みをご覧ください。このフィールド内で直接渡される音声は、時間が 1 分に制限されます。

とありますので、埋め込まれた(=直接Postできる)ファイルサイズは、1分(10MB)で制限されているようです。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/12/28 11:13

    回答ありがとうございます。

    調べてみたところ
    非同期リクエストはGoogle Cloud Storageにデータを置いておく必要があるみたいですね!

    uriフィールドをよく理解できていないので、教えていただけませんか?

    キャンセル

  • 2017/12/28 11:23

    speech.php を使うのであれば、ファイル名を記載していた部分が、バケットのオブジェクトへのパスになります。具体的には、バケットにアップロードした際の「バケット名」と「ファイル名」を使って、「gs://バケット名/ファイル名」とします。

    キャンセル

  • 2017/12/28 11:42

    ありがとうございます!
    実行してみたところ、エラーの状況が変わりました。

    もしよろしければ、
    [Google\Cloud\Core\Exception\ServiceException]
    {
    "error": {
    "code": 403,
    "message": "The caller does not have permission",
    "status": "PERMISSION_DENIED"
    }
    }

    こちらに対する解決策も教えていただけませんでしょか...

    キャンセル

  • 2017/12/28 11:54 編集

    バケットのファイルに対するアクセス制限(ACL)は、どうなっていますか? (バケットのデフォルトは、メンバー以外は非公開ファイルだったと思います。)

    https://cloud.google.com/speech/docs/basics?hl=ja#uri-audio に記載がありますが、「Google Cloud Storage ファイルを読み取るには、次のいずれかの適切なアクセス許可が必要です。」とあります。

    とりあえずのテストであれば、読み取り専用一般公開として、バケットの ACL に publicRead を追加してください。( https://cloud.google.com/storage/docs/access-control/lists?hl=ja#predefined-project-private )

    キャンセル

  • 2017/12/28 12:09

    分かりやすくしていただき、本当にありがとうございます。

    重ねて申し訳ないのですが、
    実行中に

    [Exception]
    Job has not yet completed

    このようなエラーで止まってしまいます。
    調べてみたのですが、分からなくて
    こちらの解決法はいかがでしょうか・・・?

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

ただいまの回答率

91.25%

関連した質問

同じタグがついた質問を見る

  • PHP

    15688questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • Linux

    2822questions

    Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

  • API

    1080questions

    APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

  • Google API

    353questions

    Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

  • Google Cloud Platform

    57questions