とあるサイトにて、https://sample.com/?p=123 となるようなhref属性を持ったAタグが多数あります。
それらを取得して吐き出すと正確にAタグは取れており、p=を含むリストが多数あることがわかります。
しかし、下記コードにて、p=を含むものだけを吐き出そうとしても、1つも吐き出されません。
Win10にインストーラにてruby環境を構築しています。
スクリプト自体はUTF-8ですが、文字エンコーディングの変換などが必要なのでしょうか。
ruby
1 # Aタグを抽出 2 href_list = driver.page_source.scan(%r!<a href="([^\"]+)">!) 3 4 # p href_list 5 href_list.each do |href| 6 check = href.include?("p=") 7 if check 8 print("文字列の中に「p=」は含まれます¥n") 9 puts href 10 end 11 end
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/01/24 12:16