Pythonの音声処理について

Pythonで、Watson Text-to-Speechを使用しています。

python
1import requests
2url = "https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=ja-JP_EmiV3Voice"
3auth = ("apikey", "*******************************")
4headers = {
5        "Content-Type": "audio/mp3"
6}
7params = {
8        "text": "あいうえお"
9}
10r = requests.post(url, auth=auth, params=params)

このようにしてよくわからない文字化けしたものが取得できました。

output
1�%N�5O��A(` ިz�Uf�H$q*6�Ug50)��[�%T��<�����^�a��إ4}o�x�����F_���a��g��V7��O!���<9���8��ԇ���j�w/��eE3h�̹����Ί杤����{3�K���Z���X�.%]� ��,������k�F4�JS�lC����0�}@�%��F�9��z:����洋g����m�Wc����V�!;%
2;��`��M������za����w���l�]��&��ժ!>�-X�<�Q�?"�h6�@Os#�:�L�[:WK���kK5W�X���v�'Z��C݂j|���|�B�U3�fJj�N��

エンコード？デコード？しなければならないと思いますが、やり方がわかりません。
これをmp3ファイルにしたいのですがどうしたらよいでしょうか？

Python 3.8.0
Watson TTS 最新版
Windows10 Pro

行動規範の内容に同意します

回答1件

ベストアンサー

面白そうなのでやってみました。

https://cloud.ibm.com/docs/services/text-to-speech?topic=text-to-speech-audioFormats&locale=ja によれば、

既定フォーマットは audio/ogg;codecs=opus
フォーマットを指定したいときは Accept 要求ヘッダーまたは accept 照会パラメータで指定せよ

とのことだったので、こんな感じでやってみたら、mp3データが返ってきました。

python:
1import requests
2
3# 微妙にURLが違ってる。なんだろうか
4url = "https://gateway-tok.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=ja-JP_EmiV3Voice"
5auth = ("apikey", "*******************************")
6# headers = {
7#         "Content-Type": "audio/mp3"
8# } 使ってないから消す
9params = {
10        "accept": "audio/mp3",  # これを追加した
11        "text": "あいうえお"
12}
13r = requests.post(url, auth=auth, params=params)
14
15# バイナリファイルに格納する
16with open('EmiV3Voice_aiueo.mp3', mode='wb') as f:
17    f.write(r.content)