質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

2回答

644閲覧

google speech to text API の出力結果の文字化け

sequelanonymous

総合スコア123

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2019/04/26 06:23

編集2022/01/12 10:55

google speech to text APIを叩いた後の出力結果は、取得できるのですが、以下のような文字化けは中々見慣れず、何かお気づきの点ありましたらご指摘いただけませんでしょうか?中身は、日本語です。

出力結果

[alternatives { transcript: "\343\201\223\343\202\214\343\202\211\343\201\256\343\202\222\346\263\250\346\204\217\343\345\205\267\344\275\223\347\232\204\343\201\252\345\225\217\351\241\214\343\202\222\351\200\232\343\201\227\343\201\246\345\255\246\347\277\222\343\202\222\351\200\262\343\202\201\343\201\246\343\201\204\343\201\215\343\201\276\343\201\227\343\202\207\343\201\206" confidence: 0.9420242309570312 } ]

追記:

python

1for i, uris in enumerate(uris_list): 2 operations = [] 3 for uri in uris: 4 audio = types.RecognitionAudio(uri=uri) 5 operations.append((uri, speech_client.long_running_recognize(config, audio))) 6 7 for index, operation in enumerate(operations): 8 uri = operation[0] 9 response = operation[1].result() 10 logger.info(response) 11 results.extend(response)

上記文字化けは、logger.info(response)のresponseの中身になります。

  • 追記
config = types.RecognitionConfig( encoding=enums.RecognitionConfig.AudioEncoding.FLAC, language_code='ja-JP')

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2019/04/26 08:11

APIに渡したパラメータ、どのような処理(print文)で提示されている出力結果が得られたのかが不明です。 それらが分かるようにソースコードを提示すると回答得られやすくなるかと思います。
oikashinoa

2019/04/27 06:51 編集

canさんが書かれているようにパラメータの中身も分かるように書かないと回答つかないですよ。 - 特にconfigが怪しいかなと思ってます。
sequelanonymous

2019/04/28 08:58

ご指摘ありがとうございます。。configの設定の中身を追記しました。
guest

回答2

0

今もこの質問を見てらっしゃる方がいるかわかりませんが、GCPのAPI群が返す文字列のエンコードはASCIIでjsonの標準がunicodeの為、そのまま見るとエスケープ処理された内容で表示されます。
なので目的の文字列を抽出し、ASCIIからutf-8に変換するか、jsonに変換する関数[json.dump][json.dumps]のパラメータにensure_ascii=Falseを設定して強制エスケープ処理を止めれば目的の文字列が見れるはずです。

投稿2021/01/18 01:30

tomy-c

総合スコア179

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

原因、解決法は不明ですが、どうもUTF-8でエンコードされたバイト列の16進表現文字列っぽいですね。

Python

1#b = b"\343\201\223\343\202\214\343\202\211\343\201\256\343\202\222\346\263\250\346\204\217\343\345\205\267\344\275\223\347\232\204\343\201\252\345\225\217\351\241\214\343\202\222\351\200\232\343\201\227\343\201\246\345\255\246\347\277\222\343\202\222\351\200\262\343\202\201\343\201\246\343\201\204\343\201\215\343\201\276\343\201\227\343\202\207\343\201\206" 2b = b"\343\201\223\343\202\214\343\202\211\343\201\256\343\202\222\346\263\250\346\204\217" # これ以降を含むと invalid continuation byte になる 3print(b.decode('utf_8')) # これらのを注意

投稿2019/04/28 21:27

can110

総合スコア38234

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問