質問するログイン新規登録

質問編集履歴

2

ご回答いただいたコードを完成させ実行した結果の追記

2018/09/01 01:40

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -58,5 +58,50 @@
58
58
  ['クリスマス', 'ローズ']
59
59
  ```
60
60
 
61
+ ###ご回答いただいたコードを完成させ実行した結果
62
+ ご回答いただいたコード
63
+ ```python
64
+ import sys
65
+ import MeCab
66
+ import mojimoji
67
+
68
+ STOP_POS = {
69
+ ('名詞', '副詞可能', '*'),
70
+ ('名詞', '非自立', '副詞可能'),
71
+ ('名詞', '非自立', '一般'),
72
+ ('名詞', '接尾', '副詞可能'),
73
+ ('名詞', '接尾', '助数詞'),
74
+ ('名詞', '数', '*'),
75
+ }
76
+
77
+ def han2zen(text):
78
+ text = mojimoji.han_to_zen(text)
79
+ return text
80
+
81
+ def extractKeyword(text):
82
+ tagger = MeCab.Tagger('-Ochasen')
83
+ tagger.parse('')
84
+ node = tagger.parseToNode(han2zen(text))
85
+ keywords = []
86
+ while node:
87
+ features = tuple(node.feature.split(","))
88
+ if features[0] == u"名詞" and features[:3] not in STOP_POS:
89
+ keywords.append(node.surface)
90
+ elif features[0] == u"形容詞" and features[1] == u"自立":
91
+ keywords.append(node.surface)
92
+ elif features[0] == u"動詞" and features[1] == u"自立":
93
+ keywords.append(node.surface)
94
+ node = node.next
95
+ return keywords
96
+
97
+ text = "ドライ・アムネシア・バラ(切り花)"
98
+ extractKeyword(text)
99
+ ```
100
+
101
+ 結果
102
+ ```
103
+ ['ドライ・アムネシア・バラ', '切り花']
104
+ ````
105
+
61
106
  ### 補足情報(FW/ツールのバージョンなど)
62
107
  Python3.6

1

誤字脱字

2018/09/01 01:40

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -9,7 +9,6 @@
9
9
  text = "ドライ・アムネシア・バラ(切花)"
10
10
  ['ドライ', 'アムネシア', 'バラ', '切花']
11
11
  ```
12
- ```
13
12
 
14
13
  ### 発生している問題・エラーメッセージ
15
14
  textが「日本・東京」の場合、出力が