質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

723閲覧

javascriptで書かれた文言をスクレイピングしたい

beginner_y

総合スコア12

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/01/22 01:13

現在、スクレイピングの勉強をしております。
試しに、TripAdvisorのページにスクレイピングをしていたところ
取得できない項目が出てきたため、質問させていただきました。

取得したいのは以下のページの「公式サイト」と書かれている項目のリンクとなります。
https://www.tripadvisor.jp/Attraction_Review-g14124519-d321408-Reviews-Nijo_Castle-Nakagyo_Kyoto_Kyoto_Prefecture_Kinki.html

該当する箇所を引っ張ってきたところ
<span class="taLnk" onclick="placementEvCall('taplc_location_detail_contact_card_ar_responsive_0', 'handlers.trackWebsiteClick', event, this, 'UTU0X2h0dHA6Ly93d3cuY2l0eS5reW90by5qcC9idW5zaGkvbmlqb2pvL19FR1Y=');">公⁠式⁠サ⁠イ⁠ト</span>

と表示されており、リンク先を見つけることができませんでした。

自身で調べたところ、Seleniumをつかってjavascriptの情報を取得する方法も見つけたのですが、そもそもコード内にURLの飛び先情報が書かれていなかったため、スクレイピングにて情報が取得できるのかわからず、質問させていただきました。

ご知見のある方いらっしゃいましたら、何卒ご教示いただければと存じます。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

それ以前の問題として、TripAdvisorの無断でのスクレイピングは、利用規約で禁止されています。

(ii)本契約に準拠する場合や当社が事前に書面で許可した場合を除き、その目的を問わず、ロボット、スパイダー、スクレイパーまたは他の自動化ツールまたは手動プロセスを使用して、サービスのコンテンツ(ユーザーのプロフィールや写真を含むがこれらに限定されない)へのアクセス、監視、複製、配信、送信、放送、表示、販売、ライセンス付与、コピー、またはその他の方法で利用すること、

投稿2019/01/22 01:19

maisumakun

総合スコア145183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

beginner_y

2019/01/22 06:39

ご回答ありがとうございます。 TripAdvisorにそのような規約が書かかれていることを見落としておりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問