質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Ruby on Rails

Ruby on Railsは、オープンソースのWebアプリケーションフレームワークです。「同じことを繰り返さない」というRailsの基本理念のもと、他のフレームワークより少ないコードで簡単に開発できるよう設計されています。

Q&A

解決済

2回答

1980閲覧

digest/sha1の意味

退会済みユーザー

退会済みユーザー

総合スコア0

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Ruby on Rails

Ruby on Railsは、オープンソースのWebアプリケーションフレームワークです。「同じことを繰り返さない」というRailsの基本理念のもと、他のフレームワークより少ないコードで簡単に開発できるよう設計されています。

0グッド

1クリップ

投稿2017/08/24 10:56

###該当のソースコード

# -*- coding: utf-8 -*- require 'open-uri' require 'digest/sha1' def crawler(url) hash_str = Digest::SHA1.hexdigest(url) path="files/"+hash_str if !File.exist?(path) source = open(url).read open(path,'w+b') {|f| f.write(source)} end end url = "http://www.yahoo.co.jp/" crawler(url)

ファイルを取得して保存をするコードです。

ハッシュ値をASCIIコードを使って16進数の文字列にエンコードをする。
SHA1は40バイト。

とあるのですが一体何のためにこれをしているのでしょうか??「」内の文章の意味をわかりやすく教えて欲しいです。

またDigest::SHA1.hexdigestはSHA1.hexdigestだけで書くのはなぜ駄目なのでしょうか?::が必要な場合と、クラス名.メソッドのように必要でない場合はどうやって判断をすればいいのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

一体何のためにこれをしているのでしょうか?

ハッシュ値の性質についてはotnさんの回答にもあるので割愛させて頂きます。

URLというのは通常、":"、"/"、"?"、"&"などのファイル名として適さない記号等を含んでおり、
そのままではファイル名に使用しづらいことから何らかの変換が必要となったため、
変換手段の1つとしてSHA-1という方式を使っただけではないかというのが私の推測です。
ハッシュ値の性質上、元のURLを得るのも困難ともなりますので。

Digest::SHA1.hexdigestはSHA1.hexdigestだけで書くのはなぜ駄目なのでしょうか?

フォルダが違えば同じ名前のファイルが作成できるように、
ここでは"SHA1.hexdigest"だけではどのSHA1なのかが分からないから、というのが理由です。
名前空間という考え方が関連するかと思います。
"digest/sha1"のように"/"で区切られている場合は"::"を記載する場合が多いかと思います。

ですので、下記のように特定できる情報さえあれば"::"が無くても実行することは可能です。
※元のコードを少し書き換えています。

Ruby

1# -*- coding: utf-8 -*- 2require 'open-uri' 3require 'digest/sha1' 4 5def crawler(url) 6 include Digest 7 hash_str = SHA1.hexdigest(url) 8 path="files/"+hash_str 9 if !File.exist?(path) 10 source = open(url).read 11 open(path,'w+b') {|f| f.write(source)} 12 end 13end 14 15url = "https://www.yahoo.co.jp/" 16crawler(url)

投稿2017/08/24 13:10

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/08/26 16:03

なるほど、includeを使って特定をすればSHAから始めて記載をすることもできるようになるんですね。 ご回答ありがとうございました。
guest

0

ベストアンサー

「(文字列の)ハッシュ値を求める」というのは、どんなに長い文字列でも、一定の長さのデータに変換します。Digest::SHA1なら20バイト、16進数で表すと40文字になります。
元の文字列とは長さが違うので、1対1対応はしないのですが、異なる元の文字列に対してのハッシュ値が同一となる可能性は非常に低い(同一となる可能性が低いようにハッシュ値算出アルゴリズムは作られている)ので、一致検査の高速化などに使います。
また、暗号の処理でも使われます。

この例だと、単に「ユニークな文字列の生成」に使われているようです。ファイルに保存するので、他のURLとファイル名が同一とならないように。

後半の質問は、クラス定義が、

Ruby

1class Hoge 2 def self.fuga 3 ~~ 4 end 5end

だと、Hoge.fugaでいいのですが、クラス定義が、

Ruby

1module Foo 2 class Bar 3 def self.baz 4 ~~ 5 end 6 end 7end

のように、モジュールの中の場合は、クラスのフルネームがFoo::Barになりますので、Foo::Bar.bazと呼び出します。
Fooがさらに別のモジュールAbcに入っていると、Abc::Foo::Bar.bazになります。
判断方法は、リファレンスを見るか、ソースを見るか。

投稿2017/08/24 11:55

otn

総合スコア84423

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/08/26 15:59

ユニークなファイル名にするためにするためだったのですね。ご回答ありがとうございました。 ::の方も理解ができました。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問