質問編集履歴

2

辞書の情報を追記

2020/05/31 14:45

投稿

CookieM
CookieM

スコア7

test CHANGED
File without changes
test CHANGED
@@ -103,3 +103,45 @@
103
103
  ['駿台\tスンダイ\t駿台\t名詞-固有名詞-地域-一般\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'と\tト\tと\t助詞-並立助詞\t\t', '全\tチョン\t全\t名詞-固有名詞-人名-姓\t\t', '統\tミツル\t統\t名詞-固有名詞-人名-名\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'どっち\tドッチ\tどっち\t名詞-代名詞-一般\t\t', 'が\tガ\tが\t助詞-格助詞-一般\t\t', '難しい\tムズカシイ\t難しい\t形容詞-自立\t形容詞・イ段\t基本形', '?\t?\t?\t記号-一般\t\t', 'EOS', '']
104
104
 
105
105
  ```
106
+
107
+
108
+
109
+ システム辞書とユーザー辞書の情報
110
+
111
+ ```comandline
112
+
113
+ C:\Users\username>mecab -D
114
+
115
+ filename: C:\Users\username\Documents\Tool\MeCab\etc..\dic\ipadic\sys.dic
116
+
117
+ version: 102
118
+
119
+ charset: UTF-8
120
+
121
+ type: 0
122
+
123
+ size: 392126
124
+
125
+ left size: 1316
126
+
127
+ right size: 1316
128
+
129
+
130
+
131
+ filename: C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic
132
+
133
+ version: 102
134
+
135
+ charset: UTF-8
136
+
137
+ type: 1
138
+
139
+ size: 6
140
+
141
+ left size: 1316
142
+
143
+ right size: 1316
144
+
145
+ コード
146
+
147
+ ```

1

コマンドプロンプト上での状況を追記しました

2020/05/31 14:45

投稿

CookieM
CookieM

スコア7

test CHANGED
File without changes
test CHANGED
@@ -57,3 +57,49 @@
57
57
  jupyternotebook上に反映されない原因として何が考えられるでしょうか。
58
58
 
59
59
  よろしくお願い致します。
60
+
61
+ ```comandline
62
+
63
+ C:\Users\username>echo "駿台模試と全統模試どっちが難しい?"|mecab -u C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic
64
+
65
+ " 蜷崎ゥ・繧オ螟画磁邯・*,*,*,*,*
66
+
67
+ 駿台模試 名詞,固有名詞,一般,*,*,*,すんだいもし,スンダイモシ,スンダイモシ
68
+
69
+ 險伜捷,荳€闊ャ,*,*,*,*,*
70
+
71
+ ニ全 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,*
72
+
73
+ 統模試 險伜捷,荳€闊ャ,*,*,*,*,*
74
+
75
+ ヌっ 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,*
76
+
77
+ ソが難しい 險伜捷,荳€闊ャ,*,*,*,*,*
78
+
79
+ H 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,*
80
+
81
+ " 蜷崎ゥ・繧オ螟画磁邯・*,*,*,*,*
82
+
83
+ EOS
84
+
85
+
86
+
87
+ C:\Users\username>python
88
+
89
+ Python 3.7.3 (default, Mar 27 2019, 17:13:21) [MSC v.1915 64 bit (AMD64)] :: Anaconda, Inc. on win32
90
+
91
+ ...
92
+
93
+ >>> import MeCab
94
+
95
+ >>> m = MeCab.Tagger(r"-Ochasen -u C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic")
96
+
97
+ >>> line = m.parse('駿台模試と全統模試どっちが難しい?')
98
+
99
+ >>> word = line.split('\n')
100
+
101
+ >>> word
102
+
103
+ ['駿台\tスンダイ\t駿台\t名詞-固有名詞-地域-一般\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'と\tト\tと\t助詞-並立助詞\t\t', '全\tチョン\t全\t名詞-固有名詞-人名-姓\t\t', '統\tミツル\t統\t名詞-固有名詞-人名-名\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'どっち\tドッチ\tどっち\t名詞-代名詞-一般\t\t', 'が\tガ\tが\t助詞-格助詞-一般\t\t', '難しい\tムズカシイ\t難しい\t形容詞-自立\t形容詞・イ段\t基本形', '?\t?\t?\t記号-一般\t\t', 'EOS', '']
104
+
105
+ ```