実現したいこと
・質問のタイトルの通り、何らかの方法でwebスクレイピングのようなことを実現したい
・複数URL(数百ページ)の「title」「アンカーテキスト」「リンクURL」を取得(抽出)したい
完成形のイメージ
https://teratail.com/questions/67005
過去の質問にまさに実現したい質問がありましたが、解決はされておりませんでした。
対象サイト
行き詰まっている箇所
現在、IMPORTXML関数での取得を試みていますが、取得できません。
※他のサイトでは取得できることを確認
ググってみると上記関数では全てページから取得できるわけではないようです…。
現在のスプレッドシートは以下のようなっています。
ページURL | title |
---|---|
http://xn--wlr53q.net/ | =IMPORTXML(A2,"/html/head/title") |
GASでもIMPORTXMLでも、方法は問いませんので、解決策をご教授頂けますと幸いです。
よろしくお願い致します。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/12 09:38
2018/06/13 02:35