前提
ここに質問の内容を詳しく書いてください。
(例)
pythonを用いて、競馬予想を行うために勉強中です。
今回は、pandasを使用してスクレイピングを行おうとした際に出たエラーです。
実行環境
windows11
jupyterlab Ver3.4.4
実現したいこと
netkeibaから地方競馬のデータをスクレイピングする。
発生している問題・エラーメッセージ
url = "https://nar.netkeiba.com/race/result.html?race_id="+race_id+"&mode=result" ^ SyntaxError: invalid syntax
該当のソースコード
python
1def scrape_race_results(race_id_list, pre_race_results={}): 2 race_results = pre_race_results.copy() 3 for race_id in tqdm(race_id_list): 4 if race_id in race_results.keys(): 5 continue 6 try: 7 time.sleep(1) 8 url = "https://nar.netkeiba.com/race/result.html?race_id=" + race_id + "&mode=result" 9 race_results[race_id] = pd.read_html(url)[0] 10 except IndexError: 11 continue 12 except Exception as e: 13 print(e) 14 break 15 except: 16 break 17 return race _results 18 19race_id_list = [] 20for place in (30, 35, 36, 42, 43, 44, 45, 46, 47, 48, 50, 51, 54, 55): 21 for month in range(1,13,1): 22 for day in range(1,32,1): 23 for r in range(1,13,1): 24 race_id = '2019'+ str(place).zfill(2) + str(month).zfill(2) + str(day).zfill(2) + str(r).zfill(2) 25 race_id_list.append(race_id) 26
試したこと
race_results = []を{}辞書型に変更
url = "https://nar.netkeiba.com/race/result.html?race_id=" + race_id + "&mode=result"のrace_idが上手くいっていない可能性が高いと思い、
"https://nar.netkeiba.com/race/result.html?race_id=201930080101&mode=result"を試しましたが同様のエラー
上記の"を'に変更
補足情報(FW/ツールのバージョンなど)
windows11
anaconda4.13.0
python3.9.12
jupyterlab Ver3.4.4
回答1件
あなたの回答
tips
プレビュー