YahooニュースのRSSからスクレイピングしたところ、
linkタグの値が取得できません。
http://news.yahoo.co.jp/pickup/rss.xml
xml
1. 2. 3. 4<item> 5 <title> 6 11月5日「世界津波の日」に 7 </title> 8 <link> 9 http://news.yahoo.co.jp/pickup/6183122 10 </link> 11 <pubdate> 12 Sat, 05 Dec 2015 13:51:53 +0900 13 </pubdate> 14 <enclosure length="133" url="http://i.yimg.jp/images/icon/photo.gif" type="image/gif"> 15 </enclosure> 16 <guid ispermalink="false"> 17 yahoo/news/topics/6183122 18 </guid> 19</item> 20. 21. 22.
Node.jsのcheerio-httpcliを使用しています。
var RSS_URL = "http://news.yahoo.co.jp/pickup/rss.xml"; var client = require('cheerio-httpcli'); client.fetch(RSS_URL, {}, function(err, $, res, body){ if(err){console.log("error"); return; } console.log('<< Yahoo! topics >>') $("item").each(function(idx, item){ var title = $(this).children("title").text(); var date = $(this).children("pubdate").text(); var date2 = date.substr(0, 22); var link = $(this).children("link").text(); console.log(title + " / " + date2); console.log(link); }); });
結果
% node scrape-yahoo-topics.js [14:55:02] << Yahoo! topics >> 骨董市に車突っ込む 6人けが / Sat, 05 Dec 2015 14:01 11月5日「世界津波の日」に / Sat, 05 Dec 2015 13:51 レジでの預金引き出し 開始へ / Sat, 05 Dec 2015 11:23 魚の体脂肪計 漁業関係が注目 / Sat, 05 Dec 2015 14:39 PM2.5飛散も 衛星画像で閲覧 / Sat, 05 Dec 2015 13:51 墜落で恋人失った元力士結婚 / Sat, 05 Dec 2015 12:46 朝ドラ好調の波瑠 時間ほしい / Sat, 05 Dec 2015 14:12 μ’s解散? 流出動画が波紋 / Sat, 05 Dec 2015 11:32
このようにlinkの値のところが空白で改行されてしまいます。
どうすれば、<link>タグのURLが取得できますでしょうか?
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。