質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

0回答

1560閲覧

Kaldi-gstreamerserverのオンライン認識に使用するモデルの変更方法がわからない

KoyoTanaka

総合スコア13

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2020/04/23 05:33

Kaldi「yesno」モデルを利用したリアルタイム音声認識を行いたい

現在Kaldiを用いたリアルタイム音声認識機能を作成しております。
Kaldi-gstreamerserverの構築手順を参考に構築を行い、masterサーバ・workerサーバ共に起動させて状態での、テスト用の音声ファイルの認識を確認しています。
また、ブラウザ利用のライブラリを使用し、websockets通信でのリアルタイム音声認識の実行も確認しております。
しかし、あくまで実行確認に使用したモデルはデフォルトで存在しているシェルスクリプトを流しダウンロードしたモデルとなります。
kaldi-gstreamerserverで言えば、中国語・英語・エストニア語となります。
このモデルを、kaldi/egs/yesno/s5/run.shにて作成したモデルに置き換え、リアルタイム音声認識を行いたいです。
しかし、ドキュメントをみてもモデルを入れ替える方法が載っておらず、とても困っております。
kaldi-gstreamerserverの使用するモデルをデフォルトでついているモデル以外にする方法が分かる方がいましたらご教授願いたいです。

試したこと

「HCLG.fst」「final.mdl」「words.txt」を「yesno」のものに変更し実行してみましたが、実行できませんでした。
サンプルモデルダウンロードページより、kaldi nnet3 chain model samplesの日本語をダウンロードし、上記と同じように実行すると、worker起動は問題なくできましたが、テスト音声にて実行次に出力がされませんでした。(裏でmaster・worker共に正常に「動いていました)

補足情報(FW/ツールのバージョンなど)

linux_ubuntu18.04
kaldi:https://github.com/kaldi-asr/kaldi.git
kaldi-gstreamer-server:https://github.com/alumae/kaldi-gstreamer-server.git
gst-kaldi-nnet2-online:https://github.com/alumae/gst-kaldi-nnet2-online.git

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問