質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3348閲覧

【Python】Google Text to Speech でwavファイルを作らずに音を再生する

tkymtmt

総合スコア143

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

0クリップ

投稿2019/11/18 01:28

前提・実現したいこと

Googleのapiであるtext-to-speechをpythonから呼び出し、
得られた音声データをwavファイルを作成せずにそのまま再生したい。

発生している問題・エラーメッセージ

apiのレスポンスから得られたデータをどのようにすればpyaudioで再生できるのかわかりません。

Traceback (most recent call last): File "test.py", line 34, in <module> with wave.open(audio, 'rb') as wf: File "C:\Users\tisma\Anaconda3\envs\test2\lib\wave.py", line 499, in open return Wave_read(f) File "C:\Users\tisma\Anaconda3\envs\test2\lib\wave.py", line 163, in __init__ self.initfp(f) File "C:\Users\tisma\Anaconda3\envs\test2\lib\wave.py", line 128, in initfp self._file = Chunk(file, bigendian = 0) File "C:\Users\tisma\Anaconda3\envs\test2\lib\chunk.py", line 61, in __init__ self.chunkname = file.read(4) AttributeError: 'bytes' object has no attribute 'read'

該当のソースコード

python3

1import base64 2import json 3import requests 4import pyaudio 5import wave 6import time 7 8text = 'こんにちは' 9str_url = "https://texttospeech.googleapis.com/v1beta1/text:synthesize?key=" 10str_api_key = "hogehoge" 11str_headers = {'Content-Type': 'application/json; charset=utf-8'} 12url = str_url + str_api_key 13str_json_data = { 14 'input': { 15 'text': text 16 }, 17 'voice': { 18 'languageCode': 'ja-JP', 19 'name': 'ja-JP-Wavenet-A', 20 'ssmlGender': 'FEMALE' 21 }, 22 'audioConfig': { 23 'audioEncoding': 'LINEAR16', 24 'speakingRate': 1.1, 25 'pitch': 1.0, 26 } 27 } 28 29jd = json.dumps(str_json_data) 30r = requests.post(url, data=jd, headers=str_headers) 31if r.status_code == 200: 32 parsed = json.loads(r.text) 33 audio = base64.b64decode(parsed['audioContent']) 34 with wave.open(audio, 'rb') as wf: 35 # 以下再生用処理 36 p = pyaudio.PyAudio() 37 38 def _callback(in_data, frame_count, time_info, status): 39 data = wf.readframes(frame_count) 40 return (data, pyaudio.paContinue) 41 42 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), 43 channels=wf.getnchannels(), 44 rate=wf.getframerate(), 45 output=True, 46 stream_callback=_callback) 47 48 stream.start_stream() 49 while stream.is_active(): 50 time.sleep(0.1) 51 52 stream.stop_stream() 53 stream.close() 54 p.terminate()
tachikoma👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tkymtmt

2019/11/18 06:07

ありがとうございます。なるほど確かにblockingモードの方が実装が簡単なようですね! 説明不足でしたが今回は諸事情により、別のスレッド上で再生処理を行ってほしかったのでこのような処理になってしまいました。
guest

回答1

0

自己解決

io.Bytesオブジェクト

base64でデコードしたものでio.BytesIOインスタンスを作ることで解決できました。

python

1import base64 2import json 3import requests 4import pyaudio 5import wave 6import time 7 8text = 'こんにちは' 9str_url = "https://texttospeech.googleapis.com/v1beta1/text:synthesize?key=" 10str_api_key = "hogehoge" 11str_headers = {'Content-Type': 'application/json; charset=utf-8'} 12url = str_url + str_api_key 13str_json_data = { 14 'input': { 15 'text': text 16 }, 17 'voice': { 18 'languageCode': 'ja-JP', 19 'name': 'ja-JP-Wavenet-A', 20 'ssmlGender': 'FEMALE' 21 }, 22 'audioConfig': { 23 'audioEncoding': 'LINEAR16', 24 'speakingRate': 1.1, 25 'pitch': 1.0, 26 } 27 } 28 29jd = json.dumps(str_json_data) 30r = requests.post(url, data=jd, headers=str_headers) 31if r.status_code == 200: 32 parsed = json.loads(r.text) 33 audio = base64.b64decode(parsed['audioContent']) 34 with wave.open(io.BytesIO(audio), 'rb') as wf: # 変更点 35 # 以下再生用処理 36 p = pyaudio.PyAudio() 37 38 def _callback(in_data, frame_count, time_info, status): 39 data = wf.readframes(frame_count) 40 return (data, pyaudio.paContinue) 41 42 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), 43 channels=wf.getnchannels(), 44 rate=wf.getframerate(), 45 output=True, 46 stream_callback=_callback) 47 48 stream.start_stream() 49 while stream.is_active(): 50 time.sleep(0.1) 51 52 stream.stop_stream() 53 stream.close() 54 p.terminate()

投稿2019/11/18 06:11

tkymtmt

総合スコア143

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問