java
1package tomo_scraping; 2 3import java.io.IOException; 4 5import org.jsoup.Jsoup; 6 7public class Scrapiing_tomo { 8 static String url = null; 9 static org.jsoup.nodes.Document document; 10 11 public static void main(String[] args) throws IOException { 12 url = "https://wowma.jp/category/510801/itemlist?spe_id=c_dw02&page=3&clk=1"; 13 document = Jsoup.connect(url).timeout(100000).get();// 14 System.out.println(document); 15 } 16}
出力結果
・・・・省略 <div class="mainArea"> <aside class="sidemenu ld" id="sideMenu"></aside> <div id="contents"> <!-- 検索結果 --> <div id="searchItemList"></div> ←ここの中身にある<li>を取り出したい。 <!-- 検索結果0件 --> <div id="itemNotFound"></div> <div class="bottomContentsArea"> <!-- 最近見た商品 --> <div id="viewHistory" class="recentlyViewedCarousel"></div> <div class="divisionBorder"> <!--注目のキーワード--> <section class="divisionSection" id="featuredKeyWord"></section> <!-- オススメ特集 --> <section class="divisionSection js-was" data-id="1000000000000000002" data-components="textCardText1-02" data-text="おすすめ特集"></section> <section class="divisionSection clearfix"> </section> </div> <!-- TODO カテゴリから探す(elistのみ) --> <div id="searchByCategory"></div> </div> ・・・・省略
Jsoupでスクレイピングをやろうとしております。
上記のプログラムを実行した結果、<div id="searchItemList"></div>で閉じられているため、
getElementsByTagを走らせても、取り出すことが出来ません。
HTMLの親要素・子要素全て取り出す方法をどなたかご教示頂けますでしょうか。
以上、よろしくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/02/24 14:33