s = [["I", "am", "a", "potato"],["He", "is", "a", "tomato"]]
という多次元配列があるとして、stopwordsを除去したいと考えています。
import
1nltk.download("stopwords") 2from nltk.corpus import stopwords 3stop_words = stopwords.words('english') #About 150 stopwords 4 5 6s = [["I", "am", "a", "potato"],["He", "is", "a", "tomato"]] 7[w for w in s if w not in stop_words]
上記のようなコードを実行すると、
[['I', 'am', 'a', 'potato'], ['He', 'is', 'a', 'tomato']]
と出力されてしまってstopwordsが除去できていません。
あまり情報源がなく、調べても分からなくて困っているのでどなたか教えてくださると嬉しいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/08/10 22:43