前提・実現したいこと
Jsoupでスクレイピングで指定したクラス名(".l cf")が何も出力されません。
(Yahoo!ニュース検索結果をCSVに出力)
肺炎 新聞 たった今
初ゴール決めたい スポーツ たった今
58円高 共同通信 3分前
このように出力させたいです。
どのように指定すればできるかご教授いただけないでしょうか。
発生している問題・エラーメッセージ
Elements elm = document.select(".l cf"); カテゴリーだけ出力された空っぽのCSVが作成される。
該当のソースコード
Java
1public class MainCsv { 2 3 public static void main(String[] args) { 4 // TODO 自動生成されたメソッド・スタブ 5 System.setProperty("jdk.http.auth.tunneling.disabledSchemes", ""); 6 7 Authenticator.setDefault(new Authenticator() { 8 @Override 9 protected PasswordAuthentication getPasswordAuthentication() { 10 return new PasswordAuthentication("*******", "******".toCharArray()); 11 } 12 }); 13 14 PrintWriter p = null; 15 try { 16 p = new PrintWriter(new BufferedWriter(new OutputStreamWriter( 17 new FileOutputStream("出力先パス\sample1.csv"), "Shift-JIS"))); 18 // ヘッダーを指定する 19 //ここは自由に変更可能です 20 // 列を増やしたい場合は,と列名をセットで追加してください 21 p.print("No"); 22 p.print(","); 23 p.print("Title"); 24 p.print(","); 25 p.print("datetime"); 26 p.print(","); 27 p.print("Media"); 28 p.println(); 29 //今回は列のキーとして使ってます 30 int num = 1; 31 Document document = Jsoup.connect("https://news.yahoo.co.jp/search/?p=%E5%86%8D%E7%94%9F&ei=utf-8&fr=news_sw").proxy("*******", ****).get(); 32 //クラス名やid名、タグ名など色々設定できます 33 Elements elm = document.select(".l cf"); 34 //対象エレメントが複数ある場合取り出し 35 for (Element headline : elm) { 36 Element title = headline.select(".t").first(); 37 Element text = headline.select(".a").first(); 38 Element media = headline.select(".d").first(); 39 Element date = headline.select(".ct1").first(); 40 if (title == null) 41 continue; 42 // 内容をセットする 43 p.print(num); 44 p.print(","); 45 p.print(title.text()); 46 p.print(","); 47 p.print(text.text()); 48 p.print(","); 49 p.print(date.text()); 50 p.print(","); 51 p.print(media.text()); 52 p.println(); 53 num++; 54 } 55 } catch (IOException e) { 56 System.out.println(e); 57 } finally { 58 p.close(); 59 } 60 System.out.println("ファイル出力完了!"); 61 62 } 63} 64
試したこと
クラス名を変更 (1回だけ出力される)
Elements elm = document.select(".cl");
補足情報(FW/ツールのバージョンなど)
Eclipse Pleiades2019-12・jdk1.8.0_241・jsoup-1.12.1
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/02/12 09:17
2020/02/13 05:43