質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • Python

    8529questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

julius音声認識結果だけを取り出すpython言語プログラム

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 4,101

S.J

score 3

前提・実現したいこと

今のコードを実行するとjulius規程の結果が帰って来ます。
そこで、文字列結果だけを取りたいですが、どうすればいいですか?

該当のソースコード

from future import print_function
import socket
from contextlib import closing
import commands

def main():
host = 'localhost'
port = 10500
bufsize = 4096
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect((host,port))
while True:
recv_data = sock.recv(bufsize)
print (recv_data)
if name == 'main':
main()

実際の出力

<RECOGOUT>

<SHYPO RANK="1" SCORE="-1874.638672" GRAM="0">
<WHYPO
WORD="<s>"
CLASSID="3"
PHONE="
silB
" CM="1.000"/>
<WHYPO WORD="金" CLASSID="0" PHONE="k i m u" CM="0.980"/>
<WHYPO WORD="に" CLASSID="1" PHONE="n i" CM="1.000"/>
<WHYPO WORD="行って" CLASSID="2" PHONE="i q t e"
CM="1.000"/>
<WHYPO WORD="</s>" CLASSID="4" PHONE="silE"
CM="1.000"/>
</SHYPO>
</RECOGOUT>

期待の出力

金に行って

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • matobaa

    2016/05/20 21:14

    質問に「期待する出力」と「実際の出力」を追記していただけますか。

    キャンセル

  • matobaa

    2016/06/08 16:59

    http://julius.osdn.jp/juliusbook/ja/desc_module.html を見ると julius側ではプレーンテキストで返すような設定はできないようです。 つまり、自分で結果XMLをほどくしかなさそうです。

    キャンセル

  • coco_bauer

    2016/06/09 12:03

    タグWHYPOの要素に音声認識結果が入っているように思えますが、どんな文字列を期待してるのですか? "<s>金に行って</s>"のようなもの? "k i m u n i i q t e"のようなもの? いずれも、XMLから生成するのは難しくなさそうに思えます。

    キャンセル

回答 1

checkベストアンサー

0

# coding: utf-8
# Here your code !

recv_data = '''<RECOGOUT>

<SHYPO RANK="1" SCORE="-1874.638672" GRAM="0"> 
<WHYPO WORD="<s>" CLASSID="3" PHONE=" silB " CM="1.000"/> 
<WHYPO WORD="金" CLASSID="0" PHONE="k i m u" CM="0.980"/> 
<WHYPO WORD="に" CLASSID="1" PHONE="n i" CM="1.000"/> 
<WHYPO WORD="行って" CLASSID="2" PHONE="i q t e" 
CM="1.000"/> 
<WHYPO WORD="</s>" CLASSID="4" PHONE="silE" 
CM="1.000"/> 
</SHYPO> 
</RECOGOUT>'''

def word(recv_data):
    for line in recv_data.split('\n'):
        index = line.find('WORD="')
        if index!=-1:
            line = line[index+6:line.find('"',index+6)]
            if(line!='<s>' and line!='</s>'):
                yield line

print (''.join(word(recv_data)))

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

関連した質問

同じタグがついた質問を見る

  • Python

    8529questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。