質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.44%
Julius

Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPCやスマートフォン上でほぼ実時間で実行できる軽量さとコンパクトさを持っています。

CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

Q&A

解決済

1回答

7460閲覧

linux上で音声ファイルをテキストに変換する方法

kuwako

総合スコア387

Julius

Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPCやスマートフォン上でほぼ実時間で実行できる軽量さとコンパクトさを持っています。

CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

0グッド

1クリップ

投稿2015/10/26 11:42

編集2015/10/27 02:13

Linux上で日本語の音声ファイル(mp3)をテキストに変換したいのですが、いい方法はありませんでしょうか?

試しに、mp3ファイルをffmpegを使ってwavに変換し、julius(http://julius.osdn.jp/index.php?q=doc/adin.html)で解析するという方法を使ってみたのですが、
どうやら文法ファイルを自作しないといけないらしく、さすがにそんな手間はかけられないと思い断念しました。

また、個人情報を含む可能性のあるデータをテキスト化したいので、Google Speechなどの外部にデータが残る可能性のあるサービスはあまり使いたくありません。

何かヒントだけでもいただけないでしょうか。
宜しくお願い致します。

(※OSはCentOS6.6です。)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Google Speech API を使ってrubyかpython辺りで実装するのはどうですか?
音声ファイル入力したらJSONを返してくれます。

参考:
Web Speech API Demonstration
https://www.google.com/intl/ja/chrome/demos/speech.html
Google Speech APIを使ってMacで音声認識 (ruby)
http://qiita.com/ysk_1031/items/8b8990a65bc586f33a20
Google Speech API ver.2の使い方 (python)
http://qiita.com/mountcedar/items/be1e5d54fcef8f3a4bda

投稿2015/10/26 12:30

SKYYFISH

総合スコア654

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuwako

2015/10/26 12:58

回答ありがとうございます。 しかし質問にも書いたように、音声データが個人情報を含む可能性があるため、外部のサービスを通したくないのです。すみません。
SKYYFISH

2015/10/26 13:19

全然読んでませんでした。すみません。 ただ、オープンソースのもので日本語対応のlinux向け っていうのはあまり無いみたいですね。 有料でよければ以下のAmiVoiceというのがオンプレ向けの 音声認識ソリューションをやってるそうです。 これ特徴のとこに「認識処理終了後に即座に削除することも可能です。」 ってあるので用途にピッタリなんじゃないでしょうか。 B2B向けの音声認識ソリューションはそのほとんどが セキュリティの担保されたものだと思うので、 プライバシーの保護が一番なら妥当かなと思います。 参考: AmiVoice® Cloud https://www.advanced-media.co.jp/products/service/amivoice-cloud-2
kuwako

2015/10/27 05:34

ありがとうございます!! 問い合わせをしてみました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.44%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問