前提・実現したいこと
Python初心者です。年度別のXMLファイルを読み込んで、特定のキーワードの出現回数を数え、年度およびキーワードの出現回数をCSVファイルに出力するプログラムを書いています。しかし、なぜかキーワードの出現回数が上限30となってしまいます。
発生している問題・エラーメッセージ
以下、CSVの中身です。キーワードの出現回数は30が天井となってしまっています。
※念のため元ファイルを確認したところ、30を超える回数になっているものが多数ありました。
CSV
11945 0 21946 0 31947 1 41948 3 51949 2 61950 4 71951 0 81952 5 91953 0 101954 4 111955 0 121956 4 131957 0 141958 5 151959 4 161960 1 171961 5 181962 2 191963 10 201964 23 211965 30 221966 19 231967 22 241968 16 251969 25 261970 11 271971 10 281972 17 291973 20 301974 5 311975 6 321976 12 331977 14 341978 27 351979 28 361980 14 371981 30 381982 30 391983 30 401984 30 411985 30 421986 30 431987 12 441988 27 451989 10 461990 13 471991 30 481992 30 491993 30 501994 30 511995 30 521996 30 531997 30 541998 30 551999 30 562000 30 572001 30 582002 30 592003 30 602004 30 612005 30 622006 30 632007 30 642008 30 652009 30 662010 30 672011 30 682012 30 692013 30 702014 30 712015 30 722016 30 732017 30 742018 30 752019 14
該当のソースコード
以下のようなコードを書いた結果、上記の出力となりました。
Python3
1 2from bs4 import BeautifulSoup 3import csv 4import re 5 6rec = csv.writer(open('CSVのファイル名', 'w', newline="\n", encoding = "utf-8"), delimiter= "\t") 7 8for i in range(1945, 2019+1): 9 with open('XMLのファイル名', 'r', encoding="utf-8-sig") as f: 10 soup = BeautifulSoup(f, 'lxml') 11 records = soup.find_all(text=re.compile('キーワード')) 12 count = 0 13 for r in records: 14 count+=1 15 rec.writerow([i, count])
試したこと
どこが悪いかまったくわからず、途方にくれるばかりで、何もできていません。修正すべき点をお教えいただけますと幸いです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。