前提・実現したいこと
Mecabで形態素解析をしたあと、名詞・形容詞・動詞に該当する単語のみを抽出しようとしています。teratailにあった質問の回答に載っていたコードを参考にしています。
発生している問題・エラーメッセージ
以下のコードを実行すると、抽出したい品詞以外の記号なども出力されてしまうのですが、
記号を含まないようにするには、どのようにコードを修正すべきでしょうか。
全ての記号を制御で網羅することは難しいと思いますが、できる限り記号を排除して、
抽出したい品詞だけを抽出したいです。
記号などを含んでいた入力の場合の出力結果
['日本', '/', '東京'] ['日本', '-', '東京'] ['日本', '&', '東京']
該当のソースコード
python
1import MeCab 2 3def extractKeyword(text): 4 tagger = MeCab.Tagger('-Ochasen') 5 tagger.parse('') 6 node = tagger.parseToNode(text) 7 keywords = [] 8 while node: 9 if node.feature.split(",")[0] == u"名詞": 10 keywords.append(node.surface) 11 elif node.feature.split(",")[0] == u"形容詞": 12 keywords.append(node.surface) 13 elif node.feature.split(",")[0] == u"動詞": 14 keywords.append(node.surface) 15 node = node.next 16 return keywords 17text = "日本の/東京" 18extractKeyword(text)
補足情報(FW/ツールのバージョンなど)
python3.6

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/21 07:23 編集
2018/07/21 19:59
2018/07/21 19:59