nokogiriというスクレイピングライブラリを使ってスクレイピングしたいのですが、
例えば、このサイトの「店長からひと言」のhtmlを取得したい時、
xpathを抜き出してくれるchromeのアドオンでは、xpathは以下のようになっており、
consoleからxpathを確認しても、取得できているはずです。
しかし、以下のコードを実行しても無反応です。何も帰ってきません。
# ================== # gemの読み込み # ================== require 'nokogiri' require 'open-uri' # ================== # 定数宣言 # ================== URL = "http://www.mpo.ne.jp/osaka/tenpo/esaka_shop/esaka.htm" # ================== # スクレイピング処理 # ================== # 変数宣言 charset = nil # webページにアクセスし、HTMLを取得 html = open(URL) do |f| charset = f.charset # 文字種別を取得 f.read # htmlを読み込んで変数htmlに渡す end # nokogiriで扱えるように取得したHTMLを変換 doc = Nokogiri::HTML.parse(html, nil, charset) puts doc.xpath("/html/body[@class='vsc-initialized']/div[@id='top']/div[@id='contents']/div[@id='main']/table[1]/tbody/tr[1]/td[1]")
これはどういうことなのでしょうか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。