質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

受付中

Google Speech APIでの時間付き出力の方法

kohhi
kohhi

総合スコア0

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0回答

0評価

1クリップ

2147閲覧

投稿2017/04/03 10:10

編集2022/01/12 10:55

###前提・実現したいこと
Google Speech API を使って、音声のテキスト出力を行っているのですが、
出力に、各単語が音声ファイル内のどの時間に発話されたものであるかを知りたいのですが、どのように行えばいいかわかりません、お詳しい方宜しくお願いします。

https://github\.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/transcribe_async\.py

上記のコードにマイナーチェンジを行ったもので出力を行っています。ここにどのようにコードを足せば、時間つきのファイルになるのかを知りたいです
###該当のソースコード
#!/usr/bin/env python

Copyright 2017 Google Inc. All Rights Reserved.

Licensed under the Apache License, Version 2.0 (the "License");

you may not use this file except in compliance with the License.

You may obtain a copy of the License at

http://www\.apache\.org/licenses/LICENSE-2\.0

Unless required by applicable law or agreed to in writing, software

distributed under the License is distributed on an "AS IS" BASIS,

WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

See the License for the specific language governing permissions and

limitations under the License.

"""Google Cloud Speech API sample application using the REST API for async
batch processing.

Example usage:
python transcribe_async.py resources/audio.raw
python transcribe_async.py gs://cloud-samples-tests/speech/brooklyn.flac
"""

import argparse
import io
import time

def transcribe_file(speech_file):
"""Transcribe the given audio file asynchronously."""
from google.cloud import speech
speech_client = speech.Client()

with io\.open\(speech_file, 'rb'\) as audio_file: content = audio_file\.read\(\) audio_sample = speech_client\.sample\( content, source_uri=None, encoding='FLAC', sample_rate=16000\) operation = speech_client\.speech_api\.async_recognize\(audio_sample, language_code='en-GB', speech_context=\['<登録した単語>'\], retry_count = 100 while retry_count > 0 and not operation\.complete: retry_count -= 1 time\.sleep\(2\) operation\.poll\(\) if not operation\.complete: print\('Operation not complete and retry limit reached\.'\) return alternatives = operation\.results for alternative in alternatives: print\('Transcript: {}'\.format\(alternative\.transcript\)\) print\('Confidence: {}'\.format\(alternative\.confidence\)\) # \[END send_request\]

def transcribe_gcs(gcs_uri):
"""Asynchronously transcribes the audio file specified by the gcs_uri."""
from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client\.sample\( content=None, source_uri=gcs_uri, encoding='FLAC', sample_rate=16000\) operation = speech_client\.speech_api\.async_recognize\(audio_sample\) retry_count = 100 while retry_count > 0 and not operation\.complete: retry_count -= 1 time\.sleep\(2\) operation\.poll\(\) if not operation\.complete: print\('Operation not complete and retry limit reached\.'\) return alternatives = operation\.results for alternative in alternatives: print\('Transcript: {}'\.format\(alternative\.transcript\)\) print\('Confidence: {}'\.format\(alternative\.confidence\)\) # \[END send_request_gcs\]

if name == 'main':
parser = argparse.ArgumentParser(
description=doc,
formatter_class=argparse.RawDescriptionHelpFormatter)
parser.add_argument(
'path', help='File or GCS path for audio file to be recognized')
args = parser.parse_args()
if args.path.startswith('gs://'):
transcribe_gcs(args.path)
else:
transcribe_file(args.path)

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

can110
can110

2017/04/03 15:37

「マイナーチェンジ」したソースを提示ください。
kohhi
kohhi

2017/04/04 10:07

ソース提示致しました。宜しくお願い致します。
can110
can110

2017/04/04 14:04

ソース中に「各単語」を識別する情報(処理)がないようですが、どの部分か明示ください。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。