質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.53%
Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

Q&A

解決済

2回答

11616閲覧

Pythonの音声認識ライブラリ「speech_recognition」の「Google Speech Recognition」の実体がわかりません。

tomtakeru

総合スコア4

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

0グッド

2クリップ

投稿2021/01/26 09:48

編集2021/01/26 10:11

Pythonで音声ファイルの文字起こしをしたいと思い、調べていたところ、speech_recognitionライブラリを見つけました。READMEをみてみると、様々な音声認識のエンジンやAPIがサポートされていました。その中にはGoogle Speech Recognitionというエンジンと、Google Cloud Speech APIというAPIがサポートされているのですが、「Google Speech Recognition」というエンジンがどんなものなのか、調べてもなかなかヒットしません。調べてもGoogle Cloud Speech APIについてのサイトに辿りついてしまいます。無料で使えるものなのか、また無料なのであれば、なぜGoogle Cloud Speech APIは有料なのにGoogle Speech Recognitionは無料なのか教えていただきたいです。

##調べたこと

###GitHubのサンプルコードを確認した

speech_recognitionライブラリのGitHubにGoogle Speech Recognitionを利用した音声認識のサンプルコードがありました。コメントによると
「テスト目的ならデフォルトのAPIを使ってください。他のAPIキーを利用するためには(略)こうやって指定してください。」
と記述してあります。

試しにデフォルトのAPIキーを(key=を指定しないで)利用したところ、利用できました。
デフォルトのAPIキーがどんなものなのかがわかりません。そして、なぜテスト目的以外で用いてはいけないのでしょうか。
APIというものをあまり使ったことがないため、根本的な理解が間違っているかもしれないのですが、どなたか教えていただきたいです。

以下引用コード(audio_transcribe.py)

# recognize speech using Google Speech Recognition try: # for testing purposes, we're just using the default API key # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")` # instead of `r.recognize_google(audio)` print("Google Speech Recognition thinks you said " + r.recognize_google(audio)) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e))

PyPIのサイトを確認した

「Google Speech Recognition」のAPI取得の方法を調べていたところ、speech_recognitonライブラリの古いバージョン(2.1.3)のPyPIのサイトに以下のような記述がありました。(speech_recognitionの最新バージョン(3.1.8のPyPIのサイトにはこのような記述はありませんでした。)

API Key

Google Speech Recognition API requires an API key. This library defaults to using one that was reverse engineered out of Chrome, but it is not recommended that you use this API key for anything other than personal or testing purposes.

Instead, it is best to obtain your own API key by following the steps on the API Keys page at the Chromium Developers site.

APIキーは無事に取得でき、音声認識も実行できました。手順に従いGoogle Cloud PlatformでAPIを取得したのですが、Speech APIというAPIがCloud Speech-to-Text APIとは別にあり、その概要として以下のような記述がありました。

概要

The Speech API allows developers to access Google speech-recognition services. It is only available for development and personal use.

この記述から
「Google speech-recognitionというサービスがあり、それをデベロッパが利用するときにこのAPIを使ってください。でも、開発の時の個人利用に限ります。」
と解釈しました。
その場合、開発ではなく本番環境としてGoogle Speech Recognitionを利用したい場合はどうすれば良いのでしょうか。

もしくは、Google Speech RecognitionとはGoogle Cloud Speech APIのことであり、デベロッパが利用するときの名称なのでしょうか。

(2021年01月27日 18:30)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

Chromium の API Keys のページに書いてある注意から察するに、「Speech API」を本番環境で使うことは不可能でしょう。

Google Chrome が Web Speech API を実装するために利用している Google の非公開APIなのでしょう。

投稿2021/01/26 10:10

int32_t

総合スコア20533

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tomtakeru

2021/01/28 07:41 編集

ご回答ありがとうございます。 Chromium の API Keys のページを私も確認させていただきました。本番環境のためのAPIではないということですね、、、。speech_recognitionライブラリがサポートしている他の音声認識エンジンをみていたところ、Wit.aiという無料のものがあったので、そっちで検討したいと思います。
guest

0

確信はないですが、これのことじゃないかと思います。
https://www.apps-gcp.com/ga-cloud-speech-api/

昔の https://cloud.google.com/speech/ のページ。
https://web.archive.org/web/20170701231623/https://cloud.google.com/speech/

そして今は Cloud Speech-to-Text が正式サービスであるが、
なぜか使えてしまう、ではなかろうかと。

Cloud Speech-to-Text のリリースノートを見ても、時期的に Cloud Speech API の後継の感じがします。
https://cloud.google.com/speech-to-text/docs/release-notes?hl=ja

投稿2021/01/26 10:28

68user

総合スコア2005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

68user

2021/01/26 10:35

そもそものご質問である Google Speech Recognition とは、の答えになってない気がしてきました。
tomtakeru

2021/01/28 07:39

質問に回答していただきありがとうございました。 添付のリンクを拝見させていただきました。Clound Speech APIの今までの流れについて知ることができました。ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.53%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問