質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

2回答

295閲覧

Rubyによるクローラー

yuriko

総合スコア15

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2018/01/05 07:47

Rubyによるクローラー開発技法とゆう書籍を見ながら実装しております。

require 'cgi' def parse(page_source) dates = page_source.scan( %r!(¥d+)年 ?(¥d+)月 ?(¥d+)日<br />!) url_titles = page_source.scan( %r!^<a href="(.+?)">(.+?)</a><br />!) url_titles.zip(dates).map { |(aurl, atitle), ymd | [CGI.unescapeHTML(aurl), CGI.unescapeHTML(atitle), Time.local(*ymd)] } end x = parse(open("samplepage.html", &:read)) x[0,2]

この結果でエラーがでます。
エラー内容は、

sbcr2.rb:12:in `local': wrong number of arguments (given 0, expected 1..8) (ArgumentError) from sbcr2.rb:12:in `block in parse' from sbcr2.rb:10:in `map' from sbcr2.rb:10:in `parse' from sbcr2.rb:17:in `<main>'

です。
page_sourceにurlがないのもエラー原因かと思い、このコードを付け足しましたが、結果変わらずでした。

# page_source = open("samplepage.html", &:read)

コードは書籍通り書いております。
ご教示お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

dates を得る正規表現が

rb

1 %r!(¥d+)年 ?(¥d+)月 ?(¥d+)日<br />!)

となっていますが,この ¥ がバックスラッシュ(\,U+005C)になっていないのが原因ではないでしょうか。
つまり,正規表現が正しくないため,年月日が取れておらず,dates が空配列([])になっているのではないかと。

それがためにブロックパラメーターの ymdnil になる。

で,ymdnil のとき

rb

1Time.local(*ymd)

rb

1Time.local()

と同じです。
1〜8 個の引数が必要なところ,まったく与えられていないので,

wrong number of arguments (given 0, expected 1..8) (ArgumentError)

というエラーが出ているのではないでしょうか。

投稿2018/01/06 06:23

編集2018/01/08 10:46
scivola

総合スコア2108

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuriko

2018/01/08 09:27 編集

度々、ありがとうございます。 dates = page_source.scan( %r!(/d+)年 ?(/d+)月 ?(/d+)日<br />!) とバックスラッシュにして見ましたが、同じエラーがでてしまいました。 再度ご教示いただけらた幸いです。 よろしくおねがいたします。
scivola

2018/01/08 10:48

私が回答でバックスラッシュを誤ってスラッシュで書いてしまったせいかもしれませんが,バックスラッシュのところが間違っています。正規表現を %r!(\d+)年 ?(\d+)月 ?(\d+)日<br />! にしてみてください。
yuriko

2018/01/11 08:02

どうもありがとうございます!取得できました! この本はwindows環境で作成されたものなんですね。 毎回どうもありがとうございます!
guest

0

自己解決

Time.local(*ymd)]を消して動作させました。次に進みます。

投稿2018/01/05 10:01

yuriko

総合スコア15

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問