前提・実現したいこと
・windows10
・Node.js
E2Eテストをするために、サイト内全ページを更新、取得したいです。
サイト内ページが追加されても自動で追いかけたいです。
LPページなど、相互で繋がっていないURLもとりたいです。
試したこと
puppeteerを導入、TOPページ内aタグhrefを抽出して、
URLを取得することは出来ました。
キャプチャも問題ありません。
ですが、下記URLで取得すると差分が出ました。
下記の方が多いです。
TOPページ内から全てのURLが繋がっていないのだと思います。
http://tshinobu.com/lab/get-page-link/
補足情報
つまりは、先程のURL内でどのようなプログラムが組まれているのかを知りたいです。
当方、jsもきちんと理解していない初心者ですので、
お手柔らかに教えて頂けると嬉しいです。
あなたの回答
tips
プレビュー