形態素解析の結果の一部のみを抽出したい

Question

###前提・実現したいこと
csvファイルにある文章をPythonを経由してMeCabで形態素解析をしています。 

結果を出力する際、特定の品詞（名詞、形容詞、接続詞）と原形だけを取得したいのですが、どのようなコードを書けばいいのでしょうか。
よろしくお願いいたします。


###補足情報(言語/FW/ツール等のバージョンなど)
Mac OS 10.12.5
Python 3.6.0
MeCab of 0.996

Answer

自分が取得している際には以下のようなコードを利用しています。
```python
import MeCab

def extractKeyword(text):
    tagger = MeCab.Tagger('-Ochasen')
    tagger.parse('')
    node = tagger.parseToNode(text)
    keywords = []
    while node:
        if node.feature.split(",")[0] == u"名詞":
            keywords.append(node.surface)
        elif node.feature.split(",")[0] == u"形容詞":
             keywords.append(node.surface)
        elif node.feature.split(",")[0] == u"動詞":
             keywords.append(node.surface)
        node = node.next
    return keywords
text = "pythonでMeCabを使って形態素解析を行う。"
extractKeyword(text)
#=>['python', 'MeCab', '使っ', '形態素解析', '行う']

```

結果は配列で戻ってくる形にしています。ご自分の用途に合わせて細かい部分の調整を行えばよいかと

Answer

``parseToNode()`` を使用してください

```Python
import MeCab

mecab = MeCab.Tagger('-Ochasen')
mecab.parse('')
node = mecab.parseToNode('すもももももももものうち')
origin = []
parts = []
while node:
    origin.append(node.surface)
    parts.append(node.feature.split(',')[0])
    node = node.next

print(origin)
#=> ['', 'すもも', 'も', 'もも', 'も', 'もも', 'の', 'うち', '']

print(parts)
#=> ['BOS/EOS', '名詞', '助詞', '名詞', '助詞', '名詞', '助詞', '名詞', 'BOS/EOS']
```

> 上記のサンプルでは **BOS/EOS**も入ってますが、必用に応じて __Skip__するなり__Delete__するなりしてください

関連した質問