回答率: 85.29%

質問するログイン新規登録

トップ 518に関する質問本文中の画像URLを取り出したいです。

編集履歴

質問編集履歴

3

追記

2020/05/16 04:27

投稿

スコア106

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -16,6 +16,7 @@
 doc = Nokogiri::HTML.parse(html, nil, charset)
 image_url = doc.search('img')[数字].attribute('src').value
+#相対パスへの対応
 url_split = url.split("/")
 image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)
 ```

2

追記

2020/05/16 04:27

投稿

スコア106

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -2,4 +2,21 @@
 そこで、extractcontent.rbで画像を取り出そうと考えたのですが、imgタグを取り出せずに苦しんでいます。slackのようにURLを入力し、本文の画像を取り出すにはどのようにしたらよろしいでしょうか。
 どなたか、詳しい方いらっしゃいましたら、よろしくお願いします。
-extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。
+extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。
+### 追記
+[こちら](https://wired.jp/2020/05/12/how-to-see-the-worlds-reflection-from-a-bag-of-chips/)のサイトの本文画像を取り出そうと考えています。
+以下、不完全ですが、私が考えたコードです。
+```
+url = "サイト"
+charset = nil
+html = crawling(url)
+doc = Nokogiri::HTML.parse(html, nil, charset)
+image_url = doc.search('img')[数字].attribute('src').value
+url_split = url.split("/")
+image_url = "#{url_split[0]}/#{image_url}" unless url_split[0].match(/http.*/)
+```
+よろしくお願いします！！

1

編集

2020/05/16 04:22

投稿

スコア106

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,3 +1,5 @@
 nokogiriで画像を抽出したところ、headの画像を中心に取り出してきてしまいます。
 そこで、extractcontent.rbで画像を取り出そうと考えたのですが、imgタグを取り出せずに苦しんでいます。slackのようにURLを入力し、本文の画像を取り出すにはどのようにしたらよろしいでしょうか。
-どなたか、詳しい方いらっしゃいましたら、よろしくお願いします。
+どなたか、詳しい方いらっしゃいましたら、よろしくお願いします。
+extractcontent.rbを学ぶための良い教材を知っている方がいらっしゃいましたら、そちらでも結構です。どうぞよろしくお願いします。