ruby on railsでスクレイピングを行うとサイトからうまくスクレイピングされず文字列の部分にクエスチョンが並んでしまいます。
http://www.shugiin.go.jp/internet/itdb_annai.nsf/html/statics/syu/1giin.htm
このサイトをスクレイピングしました。
コードは以下です。
require 'mechanize'
agent = Mechanize.new
page = agent.get("http://www.shugiin.go.jp/internet/itdb_annai.nsf/html/statics/syu/1giin.htm")
elements = page.search('td')
puts elements
かえってきた答えが以下になります。
<td class="sh1td5"><tt class="sh1tt1">????2 </tt></td> <td class="sh1td8"><tt class="sh1tt1"><center>3?@?@ ?@ </center></tt></td> <td class="sh1td5"><tt class="sh1tt1"><a href="../../../../itdb_giinprof.nsf/html/profile/087.html">???쎛?@?ܓT?N</a> </tt></td> <td class="sh1td6"><tt class="sh1tt1">???̂ł? ?@???̂? </tt></td> <td class="sh1td7"><tt class="sh1tt1"><center>???? </center></tt></td> <td class="sh1td5"><tt class="sh1tt1">?{??6 </tt></td> <td class="sh1td8"><tt class="sh1tt1"><center>7?@?@ ?@ </center></tt></td> <td class="sh1td5"><tt class="sh1tt1"><a href="../../../../itdb_giinprof.nsf/html/profile/088.html">?????@?@?D?q?N</a> </tt></td> <td class="sh1td6"><tt class="sh1tt1">???Ԃ? ?@?䂤?? </tt></td> <td class="sh1td7"><tt class="sh1tt1"><center>???? </center></tt></td> <td class="sh1td5"><tt class="sh1tt1">?Q?n5 </tt></td> <td class="sh1td8"><tt class="sh1tt1"><center>7?@?@ ?@ </center></tt></td> <td class="sh1td5"><tt class="sh1tt1"><a href="../../../../itdb_giinprof.nsf/html/profile/090.html">???g?@?@???q?N</a> </tt></td> <td class="sh1td6"><tt class="sh1tt1">???? ?@?????? </tt></td> <td class="sh1td7"><tt class="sh1tt1"><center>???? </center></tt></td> <td class="sh1td5"><tt class="sh1tt1">?Q?n1 </tt></td> <td class="sh1td8"><tt class="sh1tt1"><center>2?@?@ ?@ </center></tt></td> <td class="txt02t"> ???c???v???t?B?[???̗????????́A?o?g?n?E?w???E?E???y?ѓ}???̈ꕔ???f?ڂ??Ă???A???e?́A?????R?O?N?Q?????݂̂??̂???{?ƂȂ?܂??B </td>コードが間違っているのでしょうか?
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2018/05/17 04:49