スクレイピング初心者です。
Rでスクレイピングをやりたいのですが、とりだしたい情報が取り出せなくて困っています。
厚生労働省が運営している「介護事業所・生活関連情報検索」から介護事業所の情報(テーブル)を取り出したいのですが、うまくいきません。
R
1#htmlドキュメントを取得 2page1 <- read_html("http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_024_kani=true&JigyosyoCd=1370402974-00&PrefCd=13&VersionCd=024") 3#テーブル要素の取得 4tab <- page1 %>% html_table() 5tab 6 7#何も出てこない 8 9#他のやり方も試してみたがうまくいかない 10#この場合は老人ホームの名前を取得しようとしているが… 11 12theurl <- "http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_024_kani=true&JigyosyoCd=1370402974-00&PrefCd=13&VersionCd=024" 13doc <- htmlParse(GET(theurl)) 14results <- xpathSApply(doc, "//*[@id='tableGroup-0']/table/tbody/tr[2]/td") 15results <- readHTMLTable(results[[1]]) 16results 17 18#NULLが返ってくる 19 20
どうやればうまく取り出せるでしょうか。どなたか教えていただけると助かります。よろしくお願いします。
###補足情報
R version 3.3.3を使用。
PCはWindows 8, 32bit版です。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/05/08 09:40