質問するログイン新規登録

質問編集履歴

1

質問内容を変更した

2020/11/19 06:35

投稿

-soshi-
-soshi-

スコア0

title CHANGED
@@ -1,1 +1,1 @@
1
- MeCab-ipadic-NEologdをjupyter notebook使えるようにしたい
1
+ Jupyter Notebookneologd辞書を指定て、形態素解析を行いたい
body CHANGED
@@ -1,28 +1,26 @@
1
1
  ### 前提・実現したいこと
2
2
 
3
- jupyternotebookMeCab-ipadic-NEologdを導入し新語の解析を行いたいと考えています。
3
+ jupyternotebookMeCab-ipadic-NEologd辞書用いて新語の解析を行いたいと考えています。
4
4
  まず、「WindowsでNEologd辞書を比較的簡単に入れる方法ーユーザー辞書編」
5
5
  URL: https://qiita.com/zincjp/items/c61c441426b9482b5a48
6
- こちらを参考に作業を進めました。
6
+ こちらを参考に作業を進めました。今回はpythonで使用したいので、UTF-8辞書を作成し、mecabrcファイルを編集しました。
7
7
 
8
8
  ### 発生している問題・エラーメッセージ
9
- 上記のサイトで「NEologd辞書ファイルの展開」までは完了したのですが、次の「SHIFT-jis辞書の作成」で詰まってしまいました。
10
- 記述されていた「mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csvこちらのこちらのコマンドを実したところ、以下のエラーが発生しました。
9
+ UTF-8辞書のパスは「C:\Program Files\MeCab\dic\NEologd\neologd.20200910-utf8.dicです。mecabrcファイルは8目だけを以下の写真のように編集しました。
11
- ```
12
- 'mecab-dict-index' は、内部コマンドまたは外部コマンド、
10
+ ![イメージ説明](f9ada3b038d4524cf1ebb4431b9d606c.png)
11
+ 次にJupyter Notebookで該当のソースコードを実行した結果、以下のエラーが発生しました。
12
+ ![イメージ説明](9d9346d5b38bed92e5e2d6d6592a0c12.png)
13
+ デフォルトの辞書では解析できているようですが、neologd辞書ではエラーが出ているようです。
14
+ 知識が浅いため、mecabrcファイルの編集にどのような意味があるのか、プログラムのneologd辞書の指定方法は適切なのか、理解できていません。
13
- 操作可能なプログラムまはバッチ ファイルとして認識されていません
15
+ 丁寧に教えていだける助かります。よろくお願
14
- ```
15
-
16
16
  ### 該当のソースコード
17
17
 
18
- ```管理者:コマンドプロンプト
19
- mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20190128.dic -f utf-8 -t shift-jis mecab-user-dict-seed.20190128.csv
20
- ```
18
+ ```python
19
+ import MeCab
21
20
 
22
- ### 試したこと
23
-
24
- 以下のサイトを参考に、PATH通ってないのではないかと考え、上記のサイトでダウンロードした「mecab-ipadic-neologd」のPATH追加したのですが、変わりませんでした
21
+ sentence = "欅坂46きつね食べている"
25
- 「【備忘録】MeCabの辞書に新しい単語を登録するまで」
22
+ s = MeCab.Tagger()
23
+ print(s.parse(sentence))
26
- URL: https://yyhhyy.hatenablog.com/entry/20140705/1404543041
24
+ n = MeCab.Tagger(r'-d C:/Program Files/MeCab/dic/NEologd/neologd.20200910-utf8.dic')
27
-
28
- 解決方法が分かる方、教えていただけると幸いです。よろしくお願いします。
25
+ print(n.parse(sentence))
26
+ ```