回答編集履歴

修正

2019/08/24 10:35

投稿

スコア0

answer CHANGED Viewed

@@ -47,7 +47,6 @@
     end
     sleep(rand(3..5))
     page = agent.get("https://teratail.com/feed/active/#{i + 1}")
-    break
   end
 rescue Mechanize::ResponseCodeError
   # Do Nothing

修正

2019/08/24 10:35

投稿

スコア0

answer CHANGED Viewed

@@ -25,4 +25,46 @@
   sleep(rand(3..5))
 end
-```
+```
+追記
+```Ruby
+require 'mechanize'
+require 'csv'
+agent = Mechanize.new
+agent.user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'
+  + ' AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'
+urls = []
+begin
+  page = agent.get('https://teratail.com/')
+  1.step do |i|
+    page.css('.C-questionFeedItemTitle > a').each do |a|
+      urls << 'https://teratail.com' + a['href']
+    end
+    sleep(rand(3..5))
+    page = agent.get("https://teratail.com/feed/active/#{i + 1}")
+    break
+  end
+rescue Mechanize::ResponseCodeError
+  # Do Nothing
+end
+if urls.any?
+  lines = urls.map do |url|
+    sleep(rand(3..5))
+    page = agent.get(url)
+    [page.css('.p-questionHead__ttl').text.encode('cp932')]
+  end
+  CSV.open("file.csv", "wb") do |csv|
+    lines.each { |line| csv << line }
+  end
+end
+```
+参考
+[class CSV](https://docs.ruby-lang.org/ja/latest/class/CSV.html)
+[CSV を文字コード変換しつつロード](https://qiita.com/labocho/items/8559576b71642b79df67)

修正

2019/08/24 10:31

投稿

スコア0

answer CHANGED Viewed

@@ -12,7 +12,7 @@
 loop do
   page.css('.article-title > a').each do |a|
-    urls << a.attributes['href'].text
+    urls << a['href']
   end
   break if page.css('.paging-next').empty?
   sleep(rand(3..5))
@@ -22,6 +22,7 @@
 urls.each do |url|
   page = agent.get(url)
   puts page.css('.article-title > a').text
+  sleep(rand(3..5))
 end
 ```

修正

2019/08/19 22:20

投稿

スコア0

answer CHANGED Viewed

@@ -21,7 +21,7 @@
 urls.each do |url|
   page = agent.get(url)
-  puts page.css('.article-title > a').text()
+  puts page.css('.article-title > a').text
 end
 ```

修正

2019/08/19 16:21

投稿

スコア0

answer CHANGED Viewed

@@ -14,7 +14,7 @@
   page.css('.article-title > a').each do |a|
     urls << a.attributes['href'].text
   end
-  break unless page.css('.paging-next')
+  break if page.css('.paging-next').empty?
   sleep(rand(3..5))
   page = page.link_with(text: '次のページ').click
 end

修正

2019/08/19 16:19

投稿

スコア0

answer CHANGED Viewed

@@ -12,7 +12,7 @@
 loop do
   page.css('.article-title > a').each do |a|
-    urls << a.attributes["href"].text
+    urls << a.attributes['href'].text
   end
   break unless page.css('.paging-next')
   sleep(rand(3..5))

修正

2019/08/19 16:15

投稿

スコア0

answer CHANGED Viewed

@@ -1,4 +1,4 @@
-あるサイトの記事一覧をすべて取得して各ページのタイトルを表示するクローラー。
+記事一覧をすべて取得して各ページのタイトルを表示するクローラー。
 ```Ruby
 require 'mechanize'
@@ -15,8 +15,8 @@
     urls << a.attributes["href"].text
   end
   break unless page.css('.paging-next')
+  sleep(rand(3..5))
   page = page.link_with(text: '次のページ').click
-  sleep(rand(3..5))
 end
 urls.each do |url|