#Rでのスクレイピングについての質問です。
JRAのサイトの中の、
重賞レースの一覧ページの、
table を rvest を利用してスクレイピングしています。
【 ページURL= https://www.jra.go.jp/datafile/seiseki/replay/2021/jyusyo.html 】
ここからが問題なのですが、
2002年~2005年のテーブルがなぜか5月までしか取得できません。
2006年以降は問題なくtableすべてを取得できています。
chromeの開発機能を利用し、ページ構成を確認しましたが、
原因であろう特徴は見つけることが出来ませんでした。
######なぜ5月までしか取得できないのか、の理由をご教授頂きたいと存じます。
以下スクレイピングコードになります。
R
1URL <- "https://www.jra.go.jp/datafile/seiseki/replay/2002/jyusyo.html" 2URL1 <- read_html(URL,"Shift_JIS") 3node <- html_nodes(URL1,"table") 4DB <- data.frame(html_table(node[20]))
ご回答いただけたら幸いでございます。
どうぞ、よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/01/20 12:17
2021/01/20 12:49
2021/01/23 13:17