linux上で音声ファイルをテキストに変換する方法

Linux上で日本語の音声ファイル(mp3)をテキストに変換したいのですが、いい方法はありませんでしょうか？

試しに、mp3ファイルをffmpegを使ってwavに変換し、julius(http://julius.osdn.jp/index.php?q=doc/adin.html)で解析するという方法を使ってみたのですが、
どうやら文法ファイルを自作しないといけないらしく、さすがにそんな手間はかけられないと思い断念しました。

また、個人情報を含む可能性のあるデータをテキスト化したいので、Google Speechなどの外部にデータが残る可能性のあるサービスはあまり使いたくありません。

何かヒントだけでもいただけないでしょうか。
宜しくお願い致します。

（※OSはCentOS6.6です。）

行動規範の内容に同意します

回答1件

ベストアンサー

Google Speech API を使ってrubyかpython辺りで実装するのはどうですか？
音声ファイル入力したらJSONを返してくれます。

参考:
Web Speech API Demonstration
https://www.google.com/intl/ja/chrome/demos/speech.html
Google Speech APIを使ってMacで音声認識 (ruby)
http://qiita.com/ysk_1031/items/8b8990a65bc586f33a20
Google Speech API ver.2の使い方 (python)
http://qiita.com/mountcedar/items/be1e5d54fcef8f3a4bda

投稿2015/10/26 12:30

SKYYFISH

総合スコア654

kuwako

2015/10/26 12:58

回答ありがとうございます。しかし質問にも書いたように、音声データが個人情報を含む可能性があるため、外部のサービスを通したくないのです。すみません。

SKYYFISH

2015/10/26 13:19

全然読んでませんでした。すみません。ただ、オープンソースのもので日本語対応のlinux向けっていうのはあまり無いみたいですね。有料でよければ以下のAmiVoiceというのがオンプレ向けの音声認識ソリューションをやってるそうです。これ特徴のとこに「認識処理終了後に即座に削除することも可能です。」ってあるので用途にピッタリなんじゃないでしょうか。 B2B向けの音声認識ソリューションはそのほとんどがセキュリティの担保されたものだと思うので、プライバシーの保護が一番なら妥当かなと思います。参考: AmiVoice® Cloud https://www.advanced-media.co.jp/products/service/amivoice-cloud-2

kuwako

2015/10/27 05:34

ありがとうございます！！問い合わせをしてみました！

行動規範の内容に同意します