質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

Q&A

解決済

2回答

2060閲覧

pythonとBeautifulsoupで競馬情報をスクレイピングする中で、競走データが無い馬を飛ばして情報を読み込むことが出来ず、苦慮しております!

akakage13

総合スコア89

Python 2.7

Python 2.7は2.xシリーズでは最後のメジャーバージョンです。Python3.1にある機能の多くが含まれています。

0グッド

0クリップ

投稿2017/05/30 19:57

python2.7とBeautifulsoupで競馬情報をスクレイピングする中で、競走結果が無い馬を飛ばして情報を読み込むことが出来ず、苦慮しております!

# -*- coding:utf-8 -*- import urllib2 import codecs import time from bs4 import BeautifulSoup f = codecs.open('h2007_5.csv', 'w', 'utf-8') horse_name = "" start_url = 'http://db.netkeiba.com/horse/200710{0}/' for i in xrange(1,10000): url = start_url.format(i) soup = BeautifulSoup(urllib2.urlopen(url).read(), "lxml") time.sleep(3) horse_name_tag = soup.find('div', {'class': 'horse_title'}) tr_arr1 = soup.select("table.blood_table > tr > td") t_list = tr_arr1 if horse_name_tag != None: if horse_name_tag.find('h1') != None: horse_name = horse_name_tag.find('h1').text horse_name = "".join( [x for x in horse_name_tag.text if not x == u'\xa0' and not x == u'\n']) tr_arr = soup.select("table.db_h_race_results > tbody > tr") for tr in tr_arr: tds=tr.findAll("td") race_date=tds[0].a.text #日付 print horse_name.strip(),race_date.strip() cols = [ horse_name,race_date] f.write(",".join(cols) + "\n") else: continue f.close()

上記のソースコードは、うまく動くことは動くのですが、

tr_arr = soup.select("table.db_h_race_results > tbody > tr") for tr in tr_arr: tds=tr.findAll("td") race_date=tds[0].a.text #日付 print horse_name.strip(),race_date.strip() cols = [ horse_name,race_date] f.write(",".join(cols) + "\n") else: continue f.close()

後半部分の、上記の部分以降、つまりrace_results が無い馬が現れると、プログラムが止まり困っております。

上記部分の情報がない場合でも、馬名を取得して、連続して、次の馬名を読み込んでほしいのです。

先輩方の御教示、よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

_Victorique__

2017/05/30 23:37

どういうエラーが出て止まるのか教えていただけますか?
akakage13

2017/05/30 23:56

list out of range 出走成績が無いため、tdsがないとの返事をpythonがしてきます。よろしくお願いいたします。
akakage13

2017/05/30 23:57

追伸、早々に御覧くださいましてありがとうございます。
guest

回答2

0

全然関係なくて申し訳ないのですが、

python

1 if horse_name_tag != None:

などの部分は

python

1 if horse_name_tag is not None:

にするとPEP8の警告がでなくてよいかと思います。

投稿2017/05/31 15:14

kurosuke___

総合スコア217

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akakage13

2017/06/01 11:46

E3KUROSUKE様、いつもありがとうございます!!! 早速、ソースコードを改変させていただきました。 今後とも、よろしくお願いいたします。
guest

0

ベストアンサー

python

1tr_arr = soup.select("table.db_h_race_results > tbody > tr") 2 3 for tr in tr_arr: 4 tds=tr.findAll("td") 5 if len(tds) != 0: 6 race_date=tds[0].a.text #日付 7 else: 8 race_date=""#ここはそちらで定義してください 9 10 print horse_name.strip(),race_date.strip() 11 cols = [ horse_name,race_date] 12 f.write(",".join(cols) + "\n") 13 14 else: 15 continue 16 17f.close()

条件文を追加しました。おそらくtds[0]の部分でエラーが出ていると思われるので。

投稿2017/05/31 00:27

編集2017/05/31 00:28
_Victorique__

総合スコア1392

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akakage13

2017/05/31 10:25

上手く動くようになりました!!! _victorique_様、 本当にありがとうございました!!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問