現在、スクレイピングの勉強をしております。
試しに、TripAdvisorのページにスクレイピングをしていたところ
取得できない項目が出てきたため、質問させていただきました。
取得したいのは以下のページの「公式サイト」と書かれている項目のリンクとなります。
https://www.tripadvisor.jp/Attraction_Review-g14124519-d321408-Reviews-Nijo_Castle-Nakagyo_Kyoto_Kyoto_Prefecture_Kinki.html
該当する箇所を引っ張ってきたところ
<span class="taLnk" onclick="placementEvCall('taplc_location_detail_contact_card_ar_responsive_0', 'handlers.trackWebsiteClick', event, this, 'UTU0X2h0dHA6Ly93d3cuY2l0eS5reW90by5qcC9idW5zaGkvbmlqb2pvL19FR1Y=');">公式サイト</span>
と表示されており、リンク先を見つけることができませんでした。
自身で調べたところ、Seleniumをつかってjavascriptの情報を取得する方法も見つけたのですが、そもそもコード内にURLの飛び先情報が書かれていなかったため、スクレイピングにて情報が取得できるのかわからず、質問させていただきました。
ご知見のある方いらっしゃいましたら、何卒ご教示いただければと存じます。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/01/22 06:39