質問編集履歴

1

質問内容を変更した

2020/11/19 06:35

投稿

-soshi-
-soshi-

スコア0

test CHANGED
@@ -1 +1 @@
1
- MeCab-ipadic-NEologdをjupyter notebookで使えるようにしたい
1
+ Jupyter Notebookでneologd辞書を指定て、形態素解析を行いたい
test CHANGED
@@ -2,54 +2,50 @@
2
2
 
3
3
 
4
4
 
5
- jupyternotebookMeCab-ipadic-NEologdを導入し新語の解析を行いたいと考えています。
5
+ jupyternotebookMeCab-ipadic-NEologd辞書用いて新語の解析を行いたいと考えています。
6
6
 
7
7
  まず、「WindowsでNEologd辞書を比較的簡単に入れる方法ーユーザー辞書編」
8
8
 
9
9
  URL: https://qiita.com/zincjp/items/c61c441426b9482b5a48
10
10
 
11
- こちらを参考に作業を進めました。
11
+ こちらを参考に作業を進めました。今回はpythonで使用したいので、UTF-8辞書を作成し、mecabrcファイルを編集しました。
12
12
 
13
13
 
14
14
 
15
15
  ### 発生している問題・エラーメッセージ
16
16
 
17
- 上記サイトで「NEologd辞書ファイルの展開」まで完了したですが、次「SHIFT-jis辞書の作成」で詰まってしまいました。
17
+ UTF-8辞書パスはC:\Program Files\MeCab\dic\NEologd\neologd.20200910-utf8.dic」です。mecabrcファイルは8行目だけを以下写真ように編集しました。
18
18
 
19
- 記述されていた「mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csv」こちらのこちらのコマンドを実行したところ、以下のエラーが発生しました。
19
+ ![イメージ説明](f9ada3b038d4524cf1ebb4431b9d606c.png)
20
20
 
21
- ```
21
+ 次にJupyter Notebookで該当のソースコードを実行した結果、以下のエラーが発生しました。
22
22
 
23
- 'mecab-dict-index' は、内部コマンドまたは外部コマンド、
23
+ ![イメージ説明](9d9346d5b38bed92e5e2d6d6592a0c12.png)
24
24
 
25
- 操作可能なプログラムまたはバッチ ァイとし認識されていません
25
+ トの辞書では解析できいるようですが、neologd辞書ではエラーが出ているようです
26
26
 
27
- ```
27
+ 知識が浅いため、mecabrcファイルの編集にどのような意味があるのか、プログラムのneologd辞書の指定方法は適切なのか、理解できていません。
28
28
 
29
-
29
+ 丁寧に教えていただけると助かります。よろしくお願いします。
30
30
 
31
31
  ### 該当のソースコード
32
32
 
33
33
 
34
34
 
35
- ```管理者:コマンドプロンプト
35
+ ```python
36
36
 
37
- mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csv
38
-
39
- ```
37
+ import MeCab
40
38
 
41
39
 
42
40
 
43
- ### 試したこと
41
+ sentence = "欅坂46が赤いきつねを食べている。"
44
42
 
43
+ s = MeCab.Tagger()
45
44
 
45
+ print(s.parse(sentence))
46
46
 
47
- 以下のサイトを参考に、PATHが通っていないのではないかと考え、上記のサイトでダウンロードした「mecab-ipadic-neologd」のPATHを追加したのですが、変わりませんでした。
47
+ n = MeCab.Tagger(r'-d C:/Program Files/MeCab/dic/NEologd/neologd.20200910-utf8.dic')
48
48
 
49
- 「【備忘録】MeCabの辞書に新しい単語を登録するまで」
49
+ print(n.parse(sentence))
50
50
 
51
- URL: https://yyhhyy.hatenablog.com/entry/20140705/1404543041
52
-
53
-
54
-
55
- 解決方法が分かる方、教えていただけると幸いです。よろしくお願いします。
51
+ ```