質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

解決済

Pythonの音声認識ライブラリ「speech_recognition」の「Google Speech Recognition」の実体がわかりません。

tomtakeru
tomtakeru

総合スコア4

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

2回答

-1評価

2クリップ

6287閲覧

投稿2021/01/26 09:48

編集2021/01/26 10:11

Pythonで音声ファイルの文字起こしをしたいと思い、調べていたところ、speech_recognitionライブラリを見つけました。READMEをみてみると、様々な音声認識のエンジンやAPIがサポートされていました。その中にはGoogle Speech Recognitionというエンジンと、Google Cloud Speech APIというAPIがサポートされているのですが、「Google Speech Recognition」というエンジンがどんなものなのか、調べてもなかなかヒットしません。調べてもGoogle Cloud Speech APIについてのサイトに辿りついてしまいます。無料で使えるものなのか、また無料なのであれば、なぜGoogle Cloud Speech APIは有料なのにGoogle Speech Recognitionは無料なのか教えていただきたいです。

##調べたこと

###GitHubのサンプルコードを確認した

speech_recognitionライブラリのGitHubにGoogle Speech Recognitionを利用した音声認識のサンプルコードがありました。コメントによると
「テスト目的ならデフォルトのAPIを使ってください。他のAPIキーを利用するためには(略)こうやって指定してください。」
と記述してあります。

試しにデフォルトのAPIキーを(key=を指定しないで)利用したところ、利用できました。
デフォルトのAPIキーがどんなものなのかがわかりません。そして、なぜテスト目的以外で用いてはいけないのでしょうか。
APIというものをあまり使ったことがないため、根本的な理解が間違っているかもしれないのですが、どなたか教えていただきたいです。

以下引用コード(audio_transcribe.py)

# recognize speech using Google Speech Recognition try: # for testing purposes, we're just using the default API key # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")` # instead of `r.recognize_google(audio)` print("Google Speech Recognition thinks you said " + r.recognize_google(audio)) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e))

PyPIのサイトを確認した

「Google Speech Recognition」のAPI取得の方法を調べていたところ、speech_recognitonライブラリの古いバージョン(2.1.3)のPyPIのサイトに以下のような記述がありました。(speech_recognitionの最新バージョン(3.1.8のPyPIのサイトにはこのような記述はありませんでした。)

API Key

Google Speech Recognition API requires an API key. This library defaults to using one that was reverse engineered out of Chrome, but it is not recommended that you use this API key for anything other than personal or testing purposes.

Instead, it is best to obtain your own API key by following the steps on the API Keys page at the Chromium Developers site.

APIキーは無事に取得でき、音声認識も実行できました。手順に従いGoogle Cloud PlatformでAPIを取得したのですが、Speech APIというAPIがCloud Speech-to-Text APIとは別にあり、その概要として以下のような記述がありました。

概要

The Speech API allows developers to access Google speech-recognition services. It is only available for development and personal use.

この記述から
「Google speech-recognitionというサービスがあり、それをデベロッパが利用するときにこのAPIを使ってください。でも、開発の時の個人利用に限ります。」
と解釈しました。
その場合、開発ではなく本番環境としてGoogle Speech Recognitionを利用したい場合はどうすれば良いのでしょうか。

もしくは、Google Speech RecognitionとはGoogle Cloud Speech APIのことであり、デベロッパが利用するときの名称なのでしょうか。

(2021年01月27日 18:30)

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。