質問
pythonのコードで解読できない部分があったので教えていただきたいです。
analyze(text)で[(t.surface,t.part_of_speech),...]みたいなリストが返ってくるのはわかるんですけど、
is_keyword(part)で、partに出力されたt.part_of_speechを引数として代入した時にpartがどのような値であった場合Trueが、またFalseが返ってくるのかがわからないです。r""はエスケープシーケンスを無視する事は分かったのですが(xxx|yyy|zzz)がどういう動きをしているのか教えていただきたいです。
該当のソースコード
python
1from janome.tokenizer import * 2import re 3 4TOKENIZER = Tokenizer() 5 6@staticmethod 7def analyze(text): 8 return [(t.surface, t.part_of_speech) for t in Dictionary.TOKENIZER.tokenize(text)] 9 10@staticmethod 11def is_keyword(part): 12 return bool(re.match(r"名詞,(一般|代名詞|固有名詞|サ変接続|形容動詞語幹)",part))
回答1件
あなたの回答
tips
プレビュー