質問編集履歴
3
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -34,6 +34,8 @@
|
|
34
34
|
|
35
35
|
|
36
36
|
|
37
|
+
#相対パスへの対応
|
38
|
+
|
37
39
|
url_split = url.split("/")
|
38
40
|
|
39
41
|
image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)
|
2
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -7,3 +7,37 @@
|
|
7
7
|
|
8
8
|
|
9
9
|
extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。
|
10
|
+
|
11
|
+
|
12
|
+
|
13
|
+
|
14
|
+
|
15
|
+
### 追記
|
16
|
+
|
17
|
+
[こちら](https://wired.jp/2020/05/12/how-to-see-the-worlds-reflection-from-a-bag-of-chips/)のサイトの本文画像を取り出そうと考えています。
|
18
|
+
|
19
|
+
|
20
|
+
|
21
|
+
以下、不完全ですが、私が考えたコードです。
|
22
|
+
|
23
|
+
```
|
24
|
+
|
25
|
+
url = "サイト"
|
26
|
+
|
27
|
+
charset = nil
|
28
|
+
|
29
|
+
html = crawling(url)
|
30
|
+
|
31
|
+
doc = Nokogiri::HTML.parse(html, nil, charset)
|
32
|
+
|
33
|
+
image_url = doc.search('img')[数字].attribute('src').value
|
34
|
+
|
35
|
+
|
36
|
+
|
37
|
+
url_split = url.split("/")
|
38
|
+
|
39
|
+
image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)
|
40
|
+
|
41
|
+
```
|
42
|
+
|
43
|
+
よろしくお願いします!!
|
1
編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -3,3 +3,7 @@
|
|
3
3
|
そこで、extractcontent.rbで画像を取り出そうと考えたのですが、imgタグを取り出せずに苦しんでいます。slackのようにURLを入力し、本文の画像を取り出すにはどのようにしたらよろしいでしょうか。
|
4
4
|
|
5
5
|
どなたか、詳しい方いらっしゃいましたら、よろしくお願いします。
|
6
|
+
|
7
|
+
|
8
|
+
|
9
|
+
extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。
|