poppeteerでスクレイピングをしています。
ドキュメントに従って個別要素は取得できましたが、親要素から子要素をすべて取得する方法が分かりません。
一応書いてみましたが、 list変数、document.getElementId
ではDOMが設定されていないようで page
に変更しました。また、list変数をfor文の中に入れてみましたが、 evaluate()
メソッドはitelateに対応していないようです。
エラー文
//document.getElementId ReferenceError: document is not defined //document.getElementId=>page.getElemntId TypeError: page.getElementsByClassName is not a function
itelate エラーのコード
return await page.evaluate(() => { const list = document.querySelectorAll(".topCell").textContent; const listArr = Array.from(list); const result = []; listArr.forEach(list=>{ const text = new Promise((resolve, reject)=>{ resolve(page.evaluate(() => list.querySelector(".icLarge").textContent)); }); result.push(text); }) }); //error文 // Error: Evaluation failed: TypeError: undefined is not iterable (cannot read property Symbol(Symbol.iterator))
コード全文
const puppeteer = require('puppeteer'); async function getChildElements(page, url){ await page.goto(url) // 以下をitelate文の場合上記のコードに変更する const list = document.getElementsByClassName(".parentElement"); const listArr = Array.from(list); const result = []; listArr.forEach(li=>{ const text = new Promise((resolve, reject)=>{ resolve(page.evaluate(() => li.querySelector(".childElements").textContent)); }); result.push(text); }) // ここまで } !(async() => { try { const browser = await puppeteer.launch() const page = await browser.newPage() const texts = await getChildElements(page, 'https://www.sample.com') console.log(`取得したのは${texts}です。`) browser.close() } catch(e) { console.error(e) } })()
読みづらくて申し訳ありませんが、繰り返し文を使って子要素の属性を取得する方法を教えて下さい。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。