前提・実現したいこと
python初心者です。
下記のサイトからチーム毎に各ゴールパターンのゴール数というデータを取得し、リストの形で保持したいと考えています。
http://www.football-lab.jp/summary/team_ranking/j1/?year=2018&data=goal
リスト化したい箇所はサイトでは「得点数」としてグラフ化されている部分の元データです。
[[広島,2,0,6,4,0,3,0,3,4,0],
[FC東京,3,0,3,4,2,4,1,1,2,1],
...]
というようなデータにしたいです。
発生している問題・エラーメッセージ
かなり強引にですが、beautifulsoupで該当箇所を文字列として取得する事は出来ました。
得られた文字列はチーム毎に[]で囲まれて、見た目はもう少しでリスト化出来そうなのですが、
そこから先が思いつきません。
該当のソースコード
python
1import requests 2import re 3 4from bs4 import BeautifulSoup,Comment 5 6url = "http://www.football-lab.jp/summary/team_ranking/j1/?year=2018&data=goal" 7 8response = requests.get(url) 9bs = BeautifulSoup(response.content,"lxml") 10 11test=str(bs.find(string=re.compile("function drawChart"))) 12 13test2="["+test[test.find('チーム'):test.find(',\t\t]);\n\n\t\tvar')].replace("\'","").replace("\n\t\t\t","").replace("\t\t","").replace(" ","").replace("[]","")
スクレイピングの部分ももっとスマートなやり方があれば教えて頂きたいです。。
どうぞ宜しくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/05/20 15:45
2018/05/20 23:54
2018/05/20 23:55
2018/05/22 15:27