現在Google Cloud Platformを使用しており、クラウドに置いてある音声ファイルを音声認識させることはできている状態で、
タイムオフセット機能を使いたいと思いgcpのドキュメント
https://cloud.google.com/speech/docs/basics?hl=ja
通り、jsonの中身で
"enableWordTimeOffsets":true
として音声認識apiを実行してみたのですが、返ってくる値がenableWordTimeOffsetsをtrueにしていない状態(単純な音声認識)と同じになってしまいます。
タイムオフセット機能を使うためにどうしたら良いのか知っている方がいましたら教えていただけると幸いです。
ちなみに現在一年間の無料期間中で、日本語の音声認識を試しています。
gcpのシェルで以下のようにapiを呼び出しています。
# 以下の内容のrequest.jsonをカレントディレクトリに作成 {"config": {"encoding":"FLAC", "sample_rate":16000, "language_code":"ja-JP", "enableWordTimeOffsets":true }, "audio": {"uri":"gs://for_mp3/split1.flac"} } # 以上がrequest.json $ export API_KEY=<自分のapi key> $ curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key=${API_KEY}"
あなたの回答
tips
プレビュー