質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

633閲覧

キーワードの出現回数を数えるコードを書いたのですが、なぜか上限が「30」となります

fujiko20

総合スコア19

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/04/07 03:15

前提・実現したいこと

Python初心者です。年度別のXMLファイルを読み込んで、特定のキーワードの出現回数を数え、年度およびキーワードの出現回数をCSVファイルに出力するプログラムを書いています。しかし、なぜかキーワードの出現回数が上限30となってしまいます。

発生している問題・エラーメッセージ

以下、CSVの中身です。キーワードの出現回数は30が天井となってしまっています。

※念のため元ファイルを確認したところ、30を超える回数になっているものが多数ありました。

CSV

11945 0 21946 0 31947 1 41948 3 51949 2 61950 4 71951 0 81952 5 91953 0 101954 4 111955 0 121956 4 131957 0 141958 5 151959 4 161960 1 171961 5 181962 2 191963 10 201964 23 211965 30 221966 19 231967 22 241968 16 251969 25 261970 11 271971 10 281972 17 291973 20 301974 5 311975 6 321976 12 331977 14 341978 27 351979 28 361980 14 371981 30 381982 30 391983 30 401984 30 411985 30 421986 30 431987 12 441988 27 451989 10 461990 13 471991 30 481992 30 491993 30 501994 30 511995 30 521996 30 531997 30 541998 30 551999 30 562000 30 572001 30 582002 30 592003 30 602004 30 612005 30 622006 30 632007 30 642008 30 652009 30 662010 30 672011 30 682012 30 692013 30 702014 30 712015 30 722016 30 732017 30 742018 30 752019 14

該当のソースコード

以下のようなコードを書いた結果、上記の出力となりました。

Python3

1 2from bs4 import BeautifulSoup 3import csv 4import re 5 6rec = csv.writer(open('CSVのファイル名', 'w', newline="\n", encoding = "utf-8"), delimiter= "\t") 7 8for i in range(1945, 2019+1): 9 with open('XMLのファイル名', 'r', encoding="utf-8-sig") as f: 10 soup = BeautifulSoup(f, 'lxml') 11 records = soup.find_all(text=re.compile('キーワード')) 12 count = 0 13 for r in records: 14 count+=1 15 rec.writerow([i, count])

試したこと

どこが悪いかまったくわからず、途方にくれるばかりで、何もできていません。修正すべき点をお教えいただけますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

こちら、元データの問題でした。元データはあるサイトからAPIで取得してきたのですが、その際、デフォルト設定では「上限30」となっているパラメータがあり、その影響を受けていました。お騒がせいたしました!

投稿2019/04/07 06:03

fujiko20

総合スコア19

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問