英文の自然言語処理で、特定の品詞だけ抽出したいと考えています。
Python
1import nltk 2 3nltk.download('punkt') 4nltk.download('averaged_perceptron_tagger') 5 6text = nltk.word_tokenize("We have accomplished an economic turnaround of HISTORIC proportions! https://t.co/vnmMtPv0kk") 7t = nltk.pos_tag(text)
以下が実行結果です。
[('We', 'PRP'), ('have', 'VBP'), ('accomplished', 'VBN'), ('an', 'DT'), ('economic', 'JJ'), ('turnaround', 'NN'), ('of', 'IN'), ('HISTORIC', 'NNP'), ('proportions', 'NNS'), ('!', '.'), ('https', 'NN'), (':', ':'), ('//t.co/vnmMtPv0kk', 'NN')]
文章から動詞と名詞のみを取り出したいのですが、どのようにしたら取り出せるでしょうか。
また、名詞の取り出しでは、「https://t.co/vnmMtPv0kk」の部分は不要なので省くようになっていたらありがたいです。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。