googleの無料音声認識である「Google Speech Recognition」で
人名の音声ファイルを認識させると
「さとうけんじです」->「佐藤健司です」と勝手に漢字にしていまいますが
日本人の名前は音声から判別することはほぼ不可能なので高い確率でこの変換された漢字は不正解です
これを単純に「サトウケンジデス」とカタカナまたはひらがなで発した音声を返すようにしたいのですが
どなたか方法を知っている方おられますでしょうか。
「Google Speech Recognition」のことを調べると有料の「Google Cloud Speech API」のことばかりが出てきて
目的の情報にたどり着けませんでした
「Google Speech Recognition」にこだわりはないので
他に方法をご存じの方がおりましたらお教えいただけますと幸いです
「Google Speech Recognition」は様々な利用方法がありますが
パイソンとspeech_recognitionを使ったソースの例を一応記述しておきます
この組み合わせにもこだわりはありません
import speech_recognition as sr AUDIO_FILE = 'satokenji.wav' r = sr.Recognizer() with sr.AudioFile(AUDIO_FILE) as source: audio = r.record(source) result = r.recognize_google(audio, language='ja') print('result:', result)
result:佐藤健司です
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。