質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Python

    7971questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Julius

    23questions

    Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPCやスマートフォン上でほぼ実時間で実行できる軽量さとコンパクトさを持っています。

PythonでJuliusの音声認識結果を取得したい

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 2,188

前提・実現したいこと

PythonのsubprocessでJuliusをモジュールモードで起動し、音声認識結果をテキストで受け取る。
juliusの音声認識結果はxml形式でサーバ側に渡される。
期待する出力例:

<RECOGOUT>
  <SHYPO RANK="1" SCORE="59.118156">
    <WHYPO WORD="" CLASSID="<s>" PHONE="sp_S" CM="1.000"/>
    <WHYPO WORD="さようなら" CLASSID="さようなら+感動詞" PHONE="s_B a_I y_I o:_I n_I a_I r_I a_E" CM="0.689"/>
    <WHYPO WORD="。" CLASSID="</s>" PHONE="sp_S" CM="1.000"/>
  </SHYPO>
</RECOGOUT>

発生している問題・エラーメッセージ

  1.   マイクに音声を入力しても空データしか返ってこないため、音声認識結果が出力されない(juliusが立ち上がっているのは確認できる)
  2.   PythonとJuliusの接続に失敗する(2〜3回に1回程度の割合)
Traceback (most recent call last):
  File "julius.py", line 53, in <module>
    main()
  File "julius.py", line 18, in main
    client.connect((host, port))
ConnectionRefusedError: [Errno 61] Connection refused

該当のソースコード

julius.py

# coding:utf-8
import subprocess
import socket


def main():
    # julius起動スクリプトを実行
    p = subprocess.Popen(["./dictation-kit-v4.4/run-dnn-mod.sh"], stdout=subprocess.PIPE, shell=True)
    # juliusのプロセスIDを取得
    pid = str(p.pid) 

    host = 'localhost'
    port = 10500

    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.connect((host, port))

    while 1:
        try:
            # データの受け取り バイト列で返ってくるためutf-8にデコード
            data = client.recv(1024).decode("utf-8")
            # データが空でなければ
            if len(data) > 1:
                # 出力
                print(data)
        except KeyboardInterrupt:
            print ("KeyboardInterrupt occured.")
            p.kill()
            # juliusのプロセスを終了
            subprocess.call(["kill " + pid], shell=True)
            client.close()

if __name__ == "__main__":
    main()

run-dnn-mod.sh

#! /bin/sh
PATH='dictation-kit-v4.4'
./$PATH/bin/osx/julius -C $PATH/main.jconf -C $PATH/am-dnn.jconf -module -dnnconf $PATH/julius.dnnconf $*

試したこと

ホストのIPアドレスを指定する際に host='localhost' ではなく実際に割り当てられているIPアドレスを指定したが特に効果はなかった
対話モードで実行した場合は想定通りに動作しているため原因となっている箇所が不明

補足情報(言語/FW/ツール等のバージョンなど)

実行環境
MacBook Pro(13-inch Early 2015)
macOS High Sierra 10.13.1

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

portが固定ですが、たまに接続に失敗するのは他に実行しているものがある時ではないですか?

音声に反応しないことですが、pythonからではなく直接実行すると正しい応答があるという仮定のもとで考えてよろしいのでしょうか?


追記
エラーを再現しました。
Juliusが走りだす前にソケットを開いてしまうせいみたいです。
少し待ってあげると動きます。

# coding:utf-8
import subprocess
import socket
import time

def main():
    p = subprocess.Popen("./run-dnn-mod.sh", stdout=subprocess.PIPE, shell=True)
    print('Initiating')
    time.sleep(5)
    print('Done')
    pid = str(p.pid)

    host = 'localhost'
    port = 10500

    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.connect((host, port))

    while True:
        try:
            data = client.recv(1024).decode("utf-8")
            if len(data) > 1:
                print(data)
        except KeyboardInterrupt:
            print ("KeyboardInterrupt occured.")
            p.kill()
            subprocess.call("kill " + pid, shell=True)
            client.close()
            quit()

if __name__ == "__main__":
    main()

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/01/11 13:02

    確かに常時アプリケーションを立ち上げた状態でプログラムを実行しているのでそれはあるかもしれません。

    Juliusを直接立ち上げた場合は正常に動作します。Pythonの対話モードで上のjulius.pyを各行入力、実行した場合もなぜか正常に動作します。

    キャンセル

  • 2018/01/11 22:26

    ソケットが閉じるまでラグがあるみたいですね。
    https://rcmdnk.com/blog/2015/07/03/computer-linux/

    対話モードで正常動作というのは不思議ですね。
    何かの不具合があったとみて、どこかで待ち時間を挿入してみるのも手かもしれません。

    キャンセル

  • 2018/01/12 10:47

    とりあえず待ち時間の挿入は試してみます

    キャンセル

  • 2018/01/12 10:52

    ありがとうございます、追記の内容に変更した場合に正常に動作しました。socketを使う場合はそういったポイントにも注意が必要なのですね、勉強になりました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    7971questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Julius

    23questions

    Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPCやスマートフォン上でほぼ実時間で実行できる軽量さとコンパクトさを持っています。