PDFから文字を抽出して、wordと言う変数に入れてfor文を回しています。if len(word)の後にあるelse以降は、wordをさらに1文字ずつに分けて、alreadyknownというリストがあったらそのwordを消すように(実際はword_lを結合することでwordと同じように戻している)してます。このときword_l(wordと同じ単語になっているはず)をwordlistにどんどん追加していきたいのですが、最後のword_lしか入っていないことになっています。どう対処すれば良いでしょうか?もしくはもっと良い書き方はありませんか?教えてください。
python
1for word, count in counter.most_common(): 2 csvlist = [] # csvlistを初期化 3 if len(word) < 2 or word in alreadyknown or count < 3: 4 # 一文字の単語、既に知っている単語(リストalreadyknownにある)、登場回数が2回しかないなら飛ばす。 5 pass 6 7 else: 8 word_l = list(word) 9 for word_s in word_l: 10 if word_s in alreadyknown: 11 del word_l 12 break 13 14 if 'word_l' in locals(): 15 word_l = ''.join(word_l) 16 17 wordlist =[] 18 wordlist.append(word_l) 19 20print(wordlist) 21コード
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/09/02 15:52