編集履歴

回答編集履歴

テキスト修正

2015/05/29 00:43

投稿

スコア9058

answer CHANGED Viewed

@@ -23,7 +23,7 @@
 とします。
 さらに、ruby のプログラムで正規表現を / で囲むことで作るときは、
-正規表現の中に現れる、バックスラッシュという文字にマッチさせたい
+正規表現の中に現れる、スラッシュという文字そのものにマッチさせたい
 という意図で書く、/ もエスケープする必要があるので
 http:\/\/hoge\.com

テキスト修正

2015/05/29 00:43

投稿

jun68ykt

スコア9058

answer CHANGED Viewed

@@ -127,11 +127,10 @@
 ---
 ただし、
-・srcやhrefと、その値の間に空白文字があるかもしれなかったり、
+- 属性名（srcやhref）とその値の間に、空白文字があるかもしれなかったり、
-・属性の値を囲むクオートがダブルクオートだけではなくシングルクオートも
+- 属性の値を囲むクオートがダブルクオートだけではなくシングルクオートもあるかもしれなかったり
-　あるかもしれなかったり
-・srcやhrefが大文字で、SRCやHREFとなっていることもあったり、
+- srcやhrefが大文字で、SRCやHREFとなっていることもあったり、なかったり
-　なかったり
 すると、これらに対応するために正規表現にも追加が必要になってきて、
 これもまた、先に述べた

テキスト修正

2015/05/29 00:42

投稿

jun68ykt

スコア9058

answer CHANGED Viewed

@@ -2,7 +2,7 @@
 まず、考え方として
-**abcにマッチする正規表現は、単にそのままabc**
+**abcにマッチする正規表現は、単にそのまま abc**
 です。rubyで正規表現 abc を使うときには、 / で前後を囲んで
@@ -11,13 +11,13 @@
 としますが、この例で正規表現と呼ばれるものが該当する部分は、
 上記の/ と / で囲まれた中にある、 abc です。
 これと同じで、「http://hoge.comにマッチする正規表現」を作るときは、
-まずは
+まずは、そのまま
 http://hoge.com
-から始めます。これでそのまま使えたら楽なのですが、半角ドットは、
+から始めます。このまま何も手を加えずに使えたら楽なのですが、
-ここままだと「任意の一文字」を表してしまうのでエスケープする
+半角ドットは、ここままだと「任意の一文字」を表してしまうので
-必要があり、
+エスケープする必要があり、
 http://hoge\.com
@@ -61,15 +61,21 @@
 [ykt68@sakura-vps]
 ---
 上記の例では、読み込むテキストの各行に、
 http://hoge.com
-が１つ以上あれば、その行を出力します。注意点としては
+が１つ以上あれば、その行を出力します。
-この正規表現では
+注意点としてはこの正規表現では
 http://hoge.com/test/a.php
 や
 http://hoge.comic.jp
-といったものを含む行もマッチする点なのです。しかし、これらもマッチするもので
-あっても問題がない状況も考えられます。たとえば
+といったものを含む行もマッチする点です。しかし、これらもマッチする
+正規表現であっても問題がない状況も考えられます。たとえば
 > 入力されるテキストに出てくるURLのドメインが
 > hoge.comである場合、そのURLは
 > http://hoge.com　に限られる。
@@ -120,10 +126,18 @@
 [ykt68@sakura-vps]
 ---
+ただし、
-ただし、srcやhrefと、その値の間に空白文字があるかもしれなかったり、
+・srcやhrefと、その値の間に空白文字があるかもしれなかったり、
+・属性の値を囲むクオートがダブルクオートだけではなくシングルクオートも
+　あるかもしれなかったり
+・srcやhrefが大文字で、SRCやHREFとなっていることもあったり、
+　なかったり
+すると、これらに対応するために正規表現にも追加が必要になってきて、
+これもまた、先に述べた
-属性の値を囲むクオートがダブルクオートだけではなくシングルクオートも
+入力されるテキストについてどれだけのことを知っているかに
-あるかもしれなかったりすると、これらに対応するために正規表現も追加が
+よって、書くべき正規表現の複雑さが変わってくる
-必要になってきます。
+ことの例です。
 以上、ご参考になりましたら幸いです。

テキスト修正

2015/05/29 00:29

投稿

jun68ykt

スコア9058

answer CHANGED Viewed

@@ -1,13 +1,17 @@
 こんにちは。
-まず、考え方として、「abcにマッチする正規表現」は、単にそのまま「abc」です。
+まず、考え方として
-rubyで正規表現 abc を使うときには、 / で前後を囲んで
+**abcにマッチする正規表現は、単にそのままabc**
+です。rubyで正規表現 abc を使うときには、 / で前後を囲んで
 regex = /abc/
-としますが、あくまで正規表現と呼べるものが該当するのは上記の
+としますが、この例で正規表現と呼ばれるものが該当する部分は、
-/ と / で囲まれた中にある、 abc です。
+上記の/ と / で囲まれた中にある、 abc です。
-これと同じで、「http://hoge.comにマッチする正規表現」を作るときは、まずは
+これと同じで、「http://hoge.comにマッチする正規表現」を作るときは、
+まずは
 http://hoge.com
@@ -18,14 +22,15 @@
 http://hoge\.com
 とします。
-さらに、ruby のプログラムで正規表現を / で囲むことで
+さらに、ruby のプログラムで正規表現を / で囲むことで作るときは、
+正規表現の中に現れる、バックスラッシュという文字にマッチさせたい
-作るときは、正規表現の中の / もエスケープする必要があるので
+という意図で書く、/ もエスケープする必要があるので
 http:\/\/hoge\.com
 とします。これの前後を / で囲んで
 ```lang-ruby
-regex = /http:\/\/hoge\.com/
+/http:\/\/hoge\.com/
 ```
 とすれば、rubyのプログラムの中で使えるようになります。
 以下、使用例です。
@@ -55,7 +60,27 @@
 <a href="http://hoge.com"><img src="http://img.hoge.com/0000.jpeg">
 [ykt68@sakura-vps]
 ---
+上記の例では、読み込むテキストの各行に、
+http://hoge.com
+が１つ以上あれば、その行を出力します。注意点としては
+この正規表現では
+http://hoge.com/test/a.php
+や
+http://hoge.comic.jp
+といったものを含む行もマッチする点なのです。しかし、これらもマッチするもので
+あっても問題がない状況も考えられます。たとえば
+> 入力されるテキストに出てくるURLのドメインが
+> hoge.comである場合、そのURLは
+> http://hoge.com　に限られる。
+という前提があり、それを知っていたとするならば、
+http://hoge.com　を取り出すのに、
+正規表現　http:\/\/hoge\.com で十分事足りる
+ことになります。
+つまり、入力されるテキストについてどれだけのことを知っているかに
+よって、書くべき正規表現の複雑さが変わってくるということです。
 応用として、
 入力されたHTMLに含まれる、<a>要素のhref属性または<img>要素のsrc属性の値

テキスト修正

2015/05/28 23:28

投稿

jun68ykt

スコア9058

answer CHANGED Viewed

@@ -1,11 +1,34 @@
 こんにちは。
-まず、単に http://hoge.com にマッチする正規表現は
+まず、考え方として、「abcにマッチする正規表現」は、単にそのまま「abc」です。
+rubyで正規表現 abc を使うときには、 / で前後を囲んで
+regex = /abc/
+としますが、あくまで正規表現と呼べるものが該当するのは上記の
+/ と / で囲まれた中にある、 abc です。
+これと同じで、「http://hoge.comにマッチする正規表現」を作るときは、まずは
+http://hoge.com
+から始めます。これでそのまま使えたら楽なのですが、半角ドットは、
+ここままだと「任意の一文字」を表してしまうのでエスケープする
+必要があり、
+http://hoge\.com
+とします。
+さらに、ruby のプログラムで正規表現を / で囲むことで
+作るときは、正規表現の中の / もエスケープする必要があるので
+http:\/\/hoge\.com
+とします。これの前後を / で囲んで
 ```lang-ruby
 regex = /http:\/\/hoge\.com/
 ```
+とすれば、rubyのプログラムの中で使えるようになります。
-と書けます。以下、例です。
+以下、使用例です。
 ---
 [ykt68@sakura-vps] ruby -v
@@ -44,7 +67,7 @@
 ```lang-ruby
 regex = /(href|src)="(http:\/\/hoge\.com[^"]*)"/
 ```
-以下、これの使用例です。
+以下、これの使用例です。（※ソースコードの色付けが若干おかしくなります。）
 ---
 [ykt68@sakura-vps] cat question10461-2.rb
 ```lang-xxc

テキスト修正

2015/05/28 23:09

投稿

jun68ykt

スコア9058

answer CHANGED Viewed

@@ -41,9 +41,13 @@
 という要件があったとします。
 その際は、たとえば正規表現regexを、以下のようにして取り出せます。
+```lang-ruby
+regex = /(href|src)="(http:\/\/hoge\.com[^"]*)"/
+```
+以下、これの使用例です。
 ---
 [ykt68@sakura-vps] cat question10461-2.rb
-```lang-xxx
+```lang-xxc
 # coding: utf-8
 text = <<EOS
@@ -68,5 +72,10 @@
 [ykt68@sakura-vps]
 ---
+ただし、srcやhrefと、その値の間に空白文字があるかもしれなかったり、
+属性の値を囲むクオートがダブルクオートだけではなくシングルクオートも
+あるかもしれなかったりすると、これらに対応するために正規表現も追加が
+必要になってきます。
-参考になりましたら幸いです。
+以上、ご参考になりましたら幸いです。