前提・実現したいこと
nokogiriで、以下のwikiのリスト要素を取り出そうと試みている。しかし余分なリスト要素を取り出してしまう。取り出したい箇所を限定したい。
https://ja.wikipedia.org/wiki/%E3%83%9F%E3%83%A5%E3%83%BC%E3%82%B8%E3%82%B7%E3%83%A3%E3%83%B3%E4%B8%80%E8%A6%A7_(%E3%82%B0%E3%83%AB%E3%83%BC%E3%83%97)
の あ から わ までのリスト要素
発生している問題・エラーメッセージ
"音楽の人名一覧"
"音楽グループ"や
"プライバシー・ポリシー"
等の、取り出したくない要素まで取り出されてしまう。
平易な質問ですみません。
該当のソースコード
require 'nokogiri'
f = File.open("2014.html")←ダウンロードしたHTMLファイル
doc = Nokogiri::HTML(f)
f.close()
doc.xpath('//li').each do |node|
puts node.css('a').inner_text
end
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。