htmlファイルで保存した下記のページからテキストを抽出したいと考えています。
http://realtime.search.yahoo.co.jp/search?lz=1&ei=UTF-8&rkf=1&ch=1
<div class="cnt cf" data-time="1453313838">
<h2>
Nhkが大空撮ヒマラヤ山脈とかいうのやってる見ながら寝るぞ</h2>
<p class="img"><a href="http://ord.yahoo.co.jp/o/realtime/_ylt=A7dPeCDRz59WJnIAOBBol_p7;_ylu=X3oDMTF2bGYyYWNvBHBvcwMxBHNlYwNzcgRzbGsDdHdpY28EdHdpZAM2ODk4NzQzNTcxMDM5NTE4NzIEdHd1aWQDMTYzMDczMTcyOA--/SIG=11jvvamk6/EXP=1453400401/**http%3a//twitter.com/miketamamyuu" target="_blank"><img src="http://iwiz-rts.c.yimg.jp/p/rts/zVIHPvdxwzByCBUZL2lFSfPUyRhi7XP1mKcCDBGgNR02nMOnAU24A3cCoxJeiZkT1DKFsdQk1a2DJeFPwmT5Wo9aR8gHOi0UJHvOHkPsHw--" alt="" width="48" height="48"></a></p><div class="inf cf">
<p class="lt">
「Nhkが大空撮ヒマラヤ山脈とかいうのやってる見ながら寝るぞ」という部分を抽出したいです。
ruby
1
2page_source = open("tweet.html", "r:utf-8",&:read)
3
4dates = page_source.scan(????)
5puts dates
scan(????)の????はどのように書けばよいのでしょうか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。