<tbody>
<tr onmouseout="TRMouseOut(this)" onmouseover="TRMouseOver(this)" bgcolor="#dddddd">
<td align="right">1</td>
<td align="center">秋</td>
<td align="center">冬</td>
<td align="center">月</td>
<td align="center">04396</td>
<td>かきくけこ</td>
<td>アイウエオ</td>
<td align="center">
<input type="button" name="refer" value="参照" onclick="refer('2019','0903','04396','ja_JP');" class="ui-button ui-widget ui-state-default ui-corner-all" role="button" aria-disabled="false"> </td>
</tr>
</tbody>
mechanizeを使って<td></td>に挟まれているテキストだけをスクレイピングするのどうやってかけばいいのですか?
require 'mechanize'
agent =Mechanize.new
page =agent.get("URL")
elements =page.search('tbody/tr/td')
elements.each do |ele|
puts ele.inner_text
end
htmlの指定の仕方がわかりません。
そのコードでどうなりますか?
このコードで実行しても何も出力されません。
エラーが出るわけでもなく空白になります。
手元でやってみましたが、こう表示されます。
1
秋
冬
月
04396
かきくけこ
アイウエオ
ページが取得できてないのでは?
getの次に、puts page.root.inner_html を入れてみてください。
なぜかうまく行きません。。('tbody/tr/td')このhtmlの指定の仕方は合っていますか?
getの次に、puts page.root.inner_html を入れてみてください。どう表示されますか?
<div id="dummy-portlet-3s" class="display-none fixsize-3s"></div>
<div id="dummy-portlet-2s" class="display-none fixsize-2s"></div>
<div id="dummy-portlet-s" class="display-none fixsize-s"></div>
<div id="dummy-portlet-m" class="display-none fixsize-m"></div>
<div id="dummy-portlet-l" class="display-none fixsize-l"></div>
<br>
<br>
<br>
これだけじゃないんですけどこのようなよく分からないタグがたくさん出てきます。
そこに表示されたものをみて、欲しいタグの指定をsearch()に書いてください。
内容が飛び飛びで欲しいところは空白になったりしています。毎度わかりずらくてすいません。
そこに表示されたものを私は見ていないし、あなたが何が欲しいかも知らないので、searchの引数にどう書けばいいかは、私からはアドバイスしようが無いというのは、わかりますか?
あなたの回答
tips
プレビュー