netkeiba.com様から利用させて頂いております、python2.7,beautifulsoupでの競馬情報のスクレイピングが、うまく出来ません。
# -*- coding:utf-8 -*- import urllib2 import codecs from bs4 import BeautifulSoup url='http://db.netkeiba.com/?pid=bms_leading&year=2017' soup = BeautifulSoup(urllib2.urlopen(url).read(),"lxml") tr_arr = soup.select("table.nk_tb_common.race_table_01 > tbody >tr") print tr_arr
上記のソースコードですと何も吐き出しません。
tr_arr = soup.select("table.nk_tb_common.race_table_01 > tbody >tr")
この部分でございますが、
tr_arr = soup.select("table.nk_tb_common.race_table_01")
これですと、吐き出しますので、
url='http://db.netkeiba.com/?pid=bms_leading&year=2017'
このツリー構造を確認して
> tbody >tr
を追加したものでございますが、うまくtrを吐き出してくれません。
このtrの中にございます、td要素を取り出すことが、最終目標でございます。
先輩方の御教示、よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/06/27 06:36
2017/06/27 12:31