とあるウェブサイトから画像のsrcをスクレイピングしたいのです。
lazyloadを使っているので、表示する画像ファイルは要素の中のdata-src属性に入っています。
例えば
<img src="https://is4-ssl.mzstatic.com/image/thumb/Purple118/v4/18/dd/c7/18ddc760-ad90-9c43-57d0-189368355f6d/source/100x100bb.jpg" style="border-radius: 5px;border:1px solid #cccccc" class="lazyload" data-src="https://is4-ssl.mzstatic.com/image/thumb/Purple118/v4/18/dd/c7/18ddc760-ad90-9c43-57d0-189368355f6d/source/100x100bb.jpg" alt="100x100bb.jpg" title="100x100bb.jpg" width="40px">
どうしたらdata-srcだけを抽出できるのでしょうか?
cheelio-httpcliで抽出できない場合の方法も教えていただけると幸いです。
アドバイスとご教授のほどよろしくお願いします。
あなたの回答
tips
プレビュー