回答編集履歴
1
追記
answer
CHANGED
@@ -1,3 +1,16 @@
|
|
1
1
|
未知語(辞書にない語)を考慮していないだけじゃないでしょうか?
|
2
2
|
辞書にある語は全エントリが入っているけれど、辞書にない語は(前後文脈から)6個分のエントリが**推測されている**ということかと。
|
3
|
-
単純に`split(',')`したリストの長さを確認すればいいと思いますが。
|
3
|
+
単純に`split(',')`したリストの長さを確認すればいいと思いますが。
|
4
|
+
|
5
|
+
----
|
6
|
+
(追記)
|
7
|
+
|
8
|
+
```python
|
9
|
+
unidic_tagg = MeCab.Tagger("-d /path/to/unidic-cwj-3.1.0-full")
|
10
|
+
node = unidic_tagg.parseToNode(text)
|
11
|
+
while node:
|
12
|
+
print(node.feature)
|
13
|
+
node = node.next
|
14
|
+
```
|
15
|
+
|
16
|
+
として実際のデータを目視しましたか?
|