質問編集履歴
1
質問内容を変更した
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
|
1
|
+
Jupyter Notebookでneologd辞書を指定して、形態素解析を行いたい
|
body
CHANGED
@@ -1,28 +1,26 @@
|
|
1
1
|
### 前提・実現したいこと
|
2
2
|
|
3
|
-
jupyternotebook
|
3
|
+
jupyternotebookでMeCab-ipadic-NEologd辞書を用いて新語の解析を行いたいと考えています。
|
4
4
|
まず、「WindowsでNEologd辞書を比較的簡単に入れる方法ーユーザー辞書編」
|
5
5
|
URL: https://qiita.com/zincjp/items/c61c441426b9482b5a48
|
6
|
-
こちらを参考に作業を進めました。
|
6
|
+
こちらを参考に作業を進めました。今回はpythonで使用したいので、UTF-8辞書を作成し、mecabrcファイルを編集しました。
|
7
7
|
|
8
8
|
### 発生している問題・エラーメッセージ
|
9
|
-
上記のサイトで「NEologd辞書ファイルの展開」までは完了したのですが、次の「SHIFT-jis辞書の作成」で詰まってしまいました。
|
10
|
-
|
9
|
+
UTF-8辞書のパスは「C:\Program Files\MeCab\dic\NEologd\neologd.20200910-utf8.dic」です。mecabrcファイルは8行目だけを以下の写真のように編集しました。
|
11
|
-
```
|
12
|
-
|
10
|
+

|
11
|
+
次にJupyter Notebookで該当のソースコードを実行した結果、以下のエラーが発生しました。
|
12
|
+

|
13
|
+
デフォルトの辞書では解析できているようですが、neologd辞書ではエラーが出ているようです。
|
14
|
+
知識が浅いため、mecabrcファイルの編集にどのような意味があるのか、プログラムのneologd辞書の指定方法は適切なのか、理解できていません。
|
13
|
-
|
15
|
+
丁寧に教えていただけると助かります。よろしくお願いします。
|
14
|
-
```
|
15
|
-
|
16
16
|
### 該当のソースコード
|
17
17
|
|
18
|
-
```管理者:コマンドプロンプト
|
19
|
-
mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csv
|
20
|
-
```
|
18
|
+
```python
|
19
|
+
import MeCab
|
21
20
|
|
22
|
-
### 試したこと
|
23
|
-
|
24
|
-
|
21
|
+
sentence = "欅坂46が赤いきつねを食べている。"
|
25
|
-
|
22
|
+
s = MeCab.Tagger()
|
23
|
+
print(s.parse(sentence))
|
26
|
-
|
24
|
+
n = MeCab.Tagger(r'-d C:/Program Files/MeCab/dic/NEologd/neologd.20200910-utf8.dic')
|
27
|
-
|
28
|
-
|
25
|
+
print(n.parse(sentence))
|
26
|
+
```
|