###前提・実現したいこと
はじめまして。
Rubyで「キーワードを検索したら、Googleの検索結果上位10サイトの記事タイトルと見出しをテキストで出力できる」というツールを作っています。
本やネットを参考に作っているのですが、色々と困っています汗
今質問したいのは
・実行をすると文字化けするものとそうでないものがある
・上位10サイト以外の画像・動画・ショッピング・地図といった部分を出力してしまう
他にも質問したいことは山ほどありますが、今はこの2つを解決したいです。
下記がコードになります。
###該当のソースコード
require 'anemone' require 'URI' #キーワード入力からグーグルの検索URLまで puts "キーワードを入力してください" keyword = gets.chomp word = URI.encode("https://www.google.co.jp/search?q=#{keyword}") #巡回対象サイトのURLを指定・1階層下にいって探索 Anemone.crawl(word, :delay => 3,:depth_limit => 2) do |anemone| #すべてのページに対しての処理 anemone.on_every_page do |page| page.doc.xpath("a","//h2","//h3","//h4","//h5","//h6").each do |title| puts "----------------" puts title.text end end end
###お願い
プログラミングを独学で始めて5日目なので、かなり未熟です。
わからない部分は調べますが、できるだけわかりやすくご回答していただけると助かります。
それではよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/09/13 10:30