前提・実現したいこと
RのXPATHを用いてスクレイピングで特定の情報を取得したく思います。具体的に取得したい情報のイメージは以下の画像をご参照ください。
発生している問題・エラーメッセージ
画像の紺のh2のみ取得したいのですが、グレーのh2を取得することしかできません。
該当のソースコード
RStudio
1#SITEにスクレイピング対象のウェブサイトURLを格納し、htmlを読み込む。 2SITE = "https://www.abc.ac.jp/academic/" 3html = read_html(SITE) 4 5#XPATHでh2の情報スクレイピングで取得する。 6html %>% html_nodes(xpath='//*[@id="Content"]//h2/text()') %>% html_text() 7 8
試したこと
上記ソースコードの通り、h2自体を取得することはできたのですが、画像の点線枠内の紺のh2のような形でデータ取得ができませんでした。
補足情報
イメージとしては、A課に所属しているのは田中さん、藤原さん、辻さん、B課に所属しているのは飯田さん、角田さん、進藤さんの時、"A課" "A課" "A課" "B課" "B課" "B課"といった形で6つのデータ取得したいです。
回答3件
あなたの回答
tips
プレビュー