#質問内容
Google App Scriptを使用して、Amazonの書籍の著者名を抽出するスクレイピングを実行したいと思っているのですが、うまく抽出できません…
実際にスクリプトを下に記述しておりますので、間違いの箇所を教えて頂けますと嬉しいです。
#目的
Amazonの書籍ページをWebスクレイピングして、著者名のみを抽出したいと思っています。
今回は以下の書籍ページを対象としております。
【書籍名】
起業の科学 スタートアップサイエンス
【著者名】
田所 雅之
#参考サイト
【難しくない】GASでwebスクレイピングして正規表現でデータを集める
http://www.initialsite.com/w01/14311
#実際に作成したスクリプト
著者名を含むコードを抽出するために作成したスクリプトなのですが、著者名を抽出することができませんでした…
正規表現の表記が間違えている可能性を考え、色々検証してみたのですが、正解を導くことができず…
もしお分かりの方がいましたら、教えて頂けますと嬉しいです。
GoogleAppScript
1function getBookInfo() { 2// 書籍のURLを代入 3 const url = "https://www.amazon.co.jp/%E8%B5%B7%E6%A5%AD%E3%81%AE%E7%A7%91%E5%AD%A6-%E3%82%B9%E3%82%BF%E3%83%BC%E3%83%88%E3%82%A2%E3%83%83%E3%83%97%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9-%E7%94%B0%E6%89%80-%E9%9B%85%E4%B9%8B/dp/4822259757/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&dchild=1&keywords=%E8%B5%B7%E6%A5%AD%E3%81%AE%E7%A7%91%E5%AD%A6&qid=1607859612&sr=8-1"; 4 5// 指定ページのHTMLを取得 6 const content = UrlFetchApp.fetch(url).getContentText() 7 8//正規表現を用いて著者名が含まれているコードを抽出 9 var authorRegExp = new RegExp(/<a data-asin=".*?" class="a-link-normal contributorNameID" href=".*?">(.*?)</a>/g); 10 var getDataAuthor = content.match(authorRegExp); 11 12 console.log(getDataAuthor) 13}
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/17 05:50