質問編集履歴

3

追記

2020/05/16 04:27

投稿

jack_kanzaki
jack_kanzaki

スコア106

test CHANGED
File without changes
test CHANGED
@@ -34,6 +34,8 @@
34
34
 
35
35
 
36
36
 
37
+ #相対パスへの対応
38
+
37
39
  url_split = url.split("/")
38
40
 
39
41
  image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)

2

追記

2020/05/16 04:27

投稿

jack_kanzaki
jack_kanzaki

スコア106

test CHANGED
File without changes
test CHANGED
@@ -7,3 +7,37 @@
7
7
 
8
8
 
9
9
  extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。
10
+
11
+
12
+
13
+
14
+
15
+ ### 追記
16
+
17
+ [こちら](https://wired.jp/2020/05/12/how-to-see-the-worlds-reflection-from-a-bag-of-chips/)のサイトの本文画像を取り出そうと考えています。
18
+
19
+
20
+
21
+ 以下、不完全ですが、私が考えたコードです。
22
+
23
+ ```
24
+
25
+ url = "サイト"
26
+
27
+ charset = nil
28
+
29
+ html = crawling(url)
30
+
31
+ doc = Nokogiri::HTML.parse(html, nil, charset)
32
+
33
+ image_url = doc.search('img')[数字].attribute('src').value
34
+
35
+
36
+
37
+ url_split = url.split("/")
38
+
39
+ image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)
40
+
41
+ ```
42
+
43
+ よろしくお願いします!!

1

編集

2020/05/16 04:22

投稿

jack_kanzaki
jack_kanzaki

スコア106

test CHANGED
File without changes
test CHANGED
@@ -3,3 +3,7 @@
3
3
  そこで、extractcontent.rbで画像を取り出そうと考えたのですが、imgタグを取り出せずに苦しんでいます。slackのようにURLを入力し、本文の画像を取り出すにはどのようにしたらよろしいでしょうか。
4
4
 
5
5
  どなたか、詳しい方いらっしゃいましたら、よろしくお願いします。
6
+
7
+
8
+
9
+ extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。