NEologd辞書をjanomeに導入したいのですが,うまく導入できません.
環境はwindows10 です.
bash on windows や cygwin などで試してみていますが,以下のようなエラーが出て止まってしまいます.
また,bash ubuntu on windowsでは python
コマンドが使えないため,build.py
のpython
コマンド部をpython3
に書き換えて実行しています.
解決方法を教えていただけると幸いです.
bash
1## bash on ubuntu on windows で実行した場合. 2 3$ ./build.sh \ 4> ../../mecab-ipadic-neologd/build/mecab-ipadic-2.7.0-20070801-neologd-20181126/ \ 5> utf8 6Traceback (most recent call last): 7 File "build.py", line 231, in <module> 8 collect(dicdir, enc, outdir, workdir) 9 File "build.py", line 50, in collect 10 for line in f: 11 File "C:\Users\USERNAME\AppData\Local\Programs\Python\Python36-32\lib\codecs.py", line 321, in decode 12 (result, consumed) = self._buffer_decode(data, self.errors, final) 13UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa4 in position 0: invalid start byte 14INFO:root:worker processes: 2 15INFO:root:elapsed=0sec 16Traceback (most recent call last): 17 File "build.py", line 236, in <module> 18 build_unknown_dict(dicdir, enc, outdir) 19 File "build.py", line 142, in build_unknown_dict 20 for line in f: 21 File "C:\Users\USERNAME\AppData\Local\Programs\Python\Python36-32\lib\codecs.py", line 321, in decode 22 (result, consumed) = self._buffer_decode(data, self.errors, final) 23UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 1752: invalid start byte 24 adding: sysdic/ (436 bytes security) (stored 0%) 25 adding: sysdic/connections1.py (276 bytes security) (deflated 78%) 26 adding: sysdic/connections2.py (276 bytes security) (deflated 80%) 27 adding: sysdic/__init__.py (276 bytes security) (deflated 78%) 28Build done.
参考にしているサイト
(very experimental) NEologd 辞書を内包した janome をビルドする方法 · mocobeta/janome Wiki · GitHub
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/12/02 09:27