##実現したいこと
JavaのCIをCircle CIで行おうとしております。
形態素解析器のJumanを使うので、そこをテストしたいと考えております。
出来ることならjavaのコードは変えずにテストを通したいです。
##現状
###circle.yml
yml
1machine: 2 environment: 3 LANG: ja_JP.UTF-8 4 java: 5 version: oraclejdk8 6dependencies: 7 pre: 8 - sudo apt-get update; sudo apt-get install juman
###文字化けはこんな感じ
org.junit.ComparisonFailure: expected:<0, '[話', '名詞]'> but was:<0, '[�', '̤�����]'>
###sshデバッグ
sshで接続してjumanを使ってみるとこんな感じです。
まずはターミナルの文字コードをUTF-8にすると
$ juman あああ �� �� �� ̤������ 15 ����¾ 1 * 0 * 0 NIL �あ �あ �あ ̤������ 15 ����¾ 1 * 0 * 0 NIL �� �� �� ̤������ 15 ����¾ 1 * 0 * 0 NIL � � � ̤������ 15 ����¾ 1 * 0 * 0 NIL EOS
ターミナルの文字コードをEUC-JPにすると
$ juman あああ ああ ああ ああ 指示詞 7 副詞形態指示詞 3 * 0 * 0 NIL あ あ あ 未定義語 15 その他 1 * 0 * 0 NIL EOS
でうまくいきます。
よろしくお願い致します。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/01/19 04:00