質問編集履歴
1
質問内容を変更した
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
Jupyter Notebookでneologd辞書を指定して、形態素解析を行いたい
|
test
CHANGED
@@ -2,54 +2,50 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
jupyternotebook
|
5
|
+
jupyternotebookでMeCab-ipadic-NEologd辞書を用いて新語の解析を行いたいと考えています。
|
6
6
|
|
7
7
|
まず、「WindowsでNEologd辞書を比較的簡単に入れる方法ーユーザー辞書編」
|
8
8
|
|
9
9
|
URL: https://qiita.com/zincjp/items/c61c441426b9482b5a48
|
10
10
|
|
11
|
-
こちらを参考に作業を進めました。
|
11
|
+
こちらを参考に作業を進めました。今回はpythonで使用したいので、UTF-8辞書を作成し、mecabrcファイルを編集しました。
|
12
12
|
|
13
13
|
|
14
14
|
|
15
15
|
### 発生している問題・エラーメッセージ
|
16
16
|
|
17
|
-
|
17
|
+
UTF-8辞書のパスは「C:\Program Files\MeCab\dic\NEologd\neologd.20200910-utf8.dic」です。mecabrcファイルは8行目だけを以下の写真のように編集しました。
|
18
18
|
|
19
|
-
|
19
|
+
![イメージ説明](f9ada3b038d4524cf1ebb4431b9d606c.png)
|
20
20
|
|
21
|
-
|
21
|
+
次にJupyter Notebookで該当のソースコードを実行した結果、以下のエラーが発生しました。
|
22
22
|
|
23
|
-
|
23
|
+
![イメージ説明](9d9346d5b38bed92e5e2d6d6592a0c12.png)
|
24
24
|
|
25
|
-
|
25
|
+
デフォルトの辞書では解析できているようですが、neologd辞書ではエラーが出ているようです。
|
26
26
|
|
27
|
-
|
27
|
+
知識が浅いため、mecabrcファイルの編集にどのような意味があるのか、プログラムのneologd辞書の指定方法は適切なのか、理解できていません。
|
28
28
|
|
29
|
-
|
29
|
+
丁寧に教えていただけると助かります。よろしくお願いします。
|
30
30
|
|
31
31
|
### 該当のソースコード
|
32
32
|
|
33
33
|
|
34
34
|
|
35
|
-
```
|
35
|
+
```python
|
36
36
|
|
37
|
-
mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csv
|
38
|
-
|
39
|
-
|
37
|
+
import MeCab
|
40
38
|
|
41
39
|
|
42
40
|
|
43
|
-
|
41
|
+
sentence = "欅坂46が赤いきつねを食べている。"
|
44
42
|
|
43
|
+
s = MeCab.Tagger()
|
45
44
|
|
45
|
+
print(s.parse(sentence))
|
46
46
|
|
47
|
-
|
47
|
+
n = MeCab.Tagger(r'-d C:/Program Files/MeCab/dic/NEologd/neologd.20200910-utf8.dic')
|
48
48
|
|
49
|
-
|
49
|
+
print(n.parse(sentence))
|
50
50
|
|
51
|
-
URL: https://yyhhyy.hatenablog.com/entry/20140705/1404543041
|
52
|
-
|
53
|
-
|
54
|
-
|
55
|
-
|
51
|
+
```
|