janomeを使い、スプレッドシート上の言語データを分析しようと以下のコードを書きました。
名詞や動詞など1つの品詞を選択して、別セルに出力するところまではできたのですが、
■■該当箇所■■で、詰まっています。
python
1def analyze_goiRank(cell_value): 2 t = Tokenizer() 3 4 word_dic = {} 5 lines = cell_value.split("\r\n") 6 for line in lines: 7 value_txt = t.tokenize(line) 8 for w in value_txt: 9 word = w.surface 10 ps = w.part_of_speech 11 ■■該当箇所■■if ps.find("名詞") < 0 or ps.find("動詞") < 0 or ps.find("形容詞") < 0 or ps.find("形容動詞") < 0 : continue 12 if len(word) > 1: 13 if not word in word_dic: 14 word_dic[word] = 0 15 word_dic[word] += 1 16
名詞だけを抽出するのではなく、
名詞と動詞と形容詞・形容動詞・・・の4つを抽出しようと考えて、
ps.find("名詞") < 0
の”名詞”の部分だけを変えたコードを、orで結びました。
結果は、名詞や動詞が出てくる代わりに、空白が返されてしまいます。
これをどのように修正するべきなのか、お教えいただきたく投稿致しました。
アドバイスを、どうぞよろしくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/02 12:26
2021/08/02 12:33