質問編集履歴
1
タイトルを少し変更しました
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
|
1
|
+
rubyを使ったWEBスクレイピングの問題
|
body
CHANGED
@@ -2,13 +2,9 @@
|
|
2
2
|
制約としてはrequire "net/http"を使う。
|
3
3
|
nokogiriなどのgemは利用しない。
|
4
4
|
|
5
|
-
現在、以下のようなコードでhtmlを丸ごと取得することまではできたのですが最終行のp doc.elements['(取得したい要素)'].attributesによって
|
5
|
+
現在、以下のようなコードでhtmlを丸ごと取得することまではできたのですが最終行のp doc.elements['(取得したい要素)'].attributesによって特定の要素(テーブルタグの中身など)取り出してハッシュに保存する方法がわからず
|
6
6
|
途方に暮れています。
|
7
7
|
|
8
|
-
詳しい方いらっしゃいましたらご教示ください。
|
9
|
-
|
10
|
-
|
11
|
-
|
12
8
|
require "net/http"
|
13
9
|
require 'uri'
|
14
10
|
require "rexml/document"
|
@@ -28,4 +24,6 @@
|
|
28
24
|
|
29
25
|
doc = REXML::Document.new(open(body).read)
|
30
26
|
|
31
|
-
p doc.elements['(取得したい要素)'].attributes
|
27
|
+
p doc.elements['(取得したい要素)'].attributes
|
28
|
+
|
29
|
+
詳しい方いらっしゃいましたらご教示ください。
|