質問編集履歴

1

nokogiri でうまくいかない追記

2020/07/08 19:41

投稿

shisha
shisha

スコア86

test CHANGED
@@ -1 +1 @@
1
- RubyでHTMLコードを正規表現でscanしたい
1
+ RubyでHTMLコードをscanしたい
test CHANGED
@@ -29,3 +29,37 @@
29
29
 
30
30
 
31
31
  どのようにすればよろしいでしょうか。
32
+
33
+
34
+
35
+ # nokogiri (追記)
36
+
37
+
38
+
39
+ もしくは、nokogiri などで、取り出したいのですが、それもうまくいかないです。
40
+
41
+ ```ruby
42
+
43
+ require 'open-uri'
44
+
45
+ require 'nokogiri'
46
+
47
+
48
+
49
+ url = "https://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=417AC0000000086"
50
+
51
+ doc = Nokogiri::HTML(open(url))
52
+
53
+ doc.xpath("//html").each do |e|
54
+
55
+ puts e.text.strip[0,50]
56
+
57
+ end
58
+
59
+ doc.xpath("//HTML").each do |e|
60
+
61
+ puts e.text.strip[0,50]
62
+
63
+ end
64
+
65
+ ```