質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.49%

  • Ruby

    7921questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

  • クロージャ

    19questions

    クロージャは、プログラミング言語における関数オブジェクトの一種です。 引数以外の変数を実行時の環境ではなく、 自身が定義された環境において解決することを特徴とします。

  • パース

    7questions

    パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。

parseメソッドとNokogiriを用いたopenメソッドとの使い分け方がわかりません。

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,537

cDm_48

score 164

現在、クローラーの開発をしており、書籍を読んだり、ネットで調べつつ実装を進めております。

その際に以下のようなコードをよく見ます。
・parseメソッドのみ使用している
・openメソッドのみ使用している
・parseとopenメソッドを使用している。

それぞれは開発者が違うため、好みの問題なのかな?と当初は思っていたのですが、
使い分けがあるのではないかと思っております。

しかし、書籍やネットで調べても使い分け方が載っていませんでした(調べ方が悪いのかもしれませんが)


やはり好みの問題なのでしょうか?


どなたかご存知の方がいらっしゃいましたら、ご教示願えませんでしょうか?

宜しくお願いします。


require 'open-uri'
require 'nokogiri'

uri = "http://www…"
page = URI.parse(uri).read

document = Nokogiri::HTML(page, uri, charset)

require 'open-uri'
require 'nokogiri'


document = Nokogiri::HTML(open("http://www…"))


require "open-uri"
require "rubygems"
require "nokogiri"

url = "http://www…"

charset = nil
html = open(url) do |f|
  charset = f.charset
  f.read
end
doc = Nokogiri::HTML.parse(html, nil, charset)
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

0

違いの軸が二軸あるので、それぞれ説明します。

1. Nokogiri::HTML(~) と Nokogiri::HTML.parse(~)の違い
機能に違いはありません。好みの問題でしょう。

2. 第一引数にStringを渡すか、IOもしくはStringIOを渡すかの違い
これも、好みの問題だと思います。生のHTMLを後でも使うなら、Stringで保存しておいてそれを渡すのでしょうが、そうでない場合はどちらでも同じです。
2番目の例は、closeしていないのが気になりますが、まあ実害はないでしょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/04/28 01:37

    なるほど。勉強になります。有難う御座います!!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.49%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 受付中

    【Ruby】SSL接続エラー

    前提・実現したいことAPIを利用して一定間隔(10秒)でデータを取得したい。 発生している問題・エラーメッセージSSLで接続すると下記のようなエラーになる。 SSL_connec

  • 解決済

    文字コードについて

    下記コードのcharsetに”Shift_JIS”を代入しても、charset = f.charsetにShift_JISが入らない原因は何が考えられるでしょうか? # UR

  • 解決済

    rubyでdef化する方法について

    下記ブログを参考にスクレイピングの練習をしてみようと思うのですが、仮にこのコードの内容をメソッドにして実行する場合、defを使ってどのような書き方ができるでしょうか? 参考ブ

  • 解決済

    nokogiri Ruby @media print {body,table,tr,td{displ...

    Rubyのnokogiriを使って歌詞をスクレイピングしようとしているのですが、 歌詞情報をうまく抽出できません。 というのもそのサイトのHTMLが@media print {

  • 解決済

    Nokogiri、anemone、open-uriを使って、指定したサイトをクロール、スクレイピング

    前提・実現したいこと Nokogiri、anemone、open-uriを使い、指定したウェブサイトをクローリング、スクレイピングして、画像リンクURLを取得し、そのURLから画

  • 解決済

    Ruby+Nokogiriを使って、地元の天気を取得できるようにする

    前提・実現したいこと Ruby+Nokogiriを使って、地元の天気を取得できるようにしたいと考えています。 その時に、取得地域名、取得時間、天気、今の温度、湿度、気圧、風、日

  • 解決済

    ターミナルでランダムに記事を開きたい

    前提・実現したいこと ターミナルから実行すると記事がブラウザ上でランダムに指定したURLで表示されるようにしたい 発生している問題・エラーメッセージ 文字列変換をしたブロ

  • 解決済

    [Ruby]webスクレイピング

    webスクレイピングで、<span>の中身をとりだしたいんですが、上手く実行されません。 HTML内で求めるspanが何番目にあるか数えたり、検索機能で調べたり、コード内の変数

同じタグがついた質問を見る

  • Ruby

    7921questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

  • クロージャ

    19questions

    クロージャは、プログラミング言語における関数オブジェクトの一種です。 引数以外の変数を実行時の環境ではなく、 自身が定義された環境において解決することを特徴とします。

  • パース

    7questions

    パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。