[cakephp3] メールアドレスのバリデーションの正規表現について
解決済
回答 1
投稿
- 評価
- クリップ 2
- VIEW 1,611
cakephp3 のメールアドレス形式を判定する
バリデーションが以下の正規表現になっておりました。
/^[\p{L}0-9!#$%&\'*+\/=?^_`{|}~-]+(?:\.[\p{L}0-9!#$%&\'*+\/=?^_`{|}~-]+)*@(?:[_\p{L}0-9][-_\p{L}0-9]*\.)*(?:[\p{L}0-9][-\p{L}0-9]{0,62})\.(?:(?:[a-z]{2}\.)?[a-z]{2,})$/ui
おおよそ上記の正規表現の意味は理解できたのですが、
アットマークの直後にある (?:[_\p{L}0-9][-_\p{L}0-9]*\.)* の意味が
どうしても理解できません。
より具体的にいいますと、アンダースコア(_)が入っている理由がわかりません。
そもそもホスト名、ドメイン名にはアンダースコアが入らないと思いますし、
試しに test@_test.com のような形式で入力してみましたが、しっかりとエラーになります。
正規表現上のこのアンダースコアは何を意味するのでしょうか?
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
0
正規表現上のこのアンダースコアは何を意味するのでしょうか?
アンダースコアは何ら特別な意味を持たないですね。文字通りのアンダースコアです。
ここに示してある正規表現の@マーク以降は、次のようなパターンに一致するように書いてあるように見えます。
ホスト名(アンダースコア可) + ドット + ドメイン名セカンドレベル(省略可、アンダースコア不可) + ドット + ドメイン名トップレベル(アルファベット二文字以上)。ただしホスト名+ドットはなくてもいいし二つ以上続いてもいい。
私はホスト名・ドメイン名の命名規則には詳しくないのでこのコードが意図するところが正しいのか否か判断できませんが、とにかくパターンはそうなっていると思います。ちょっとググってみるとホスト名についてはアンダースコアが使えるとする記述をみつけました。しかしさらに調べると何やら相互に矛盾する記述に行き当たり、RFCの原典を精査する気力はなかったのでそっとブラウザを閉じました。
perlですが、ちょっとしたテストスクリプトを書いてみました。
#!/usr/bin/perl
sub test1{
my($t)=@_;
print "$t\n";
$t =~ /^[\p{L}0-9!#$%&\'*+\/=?^_`{|}~-]+(?:\.[\p{L}0-9!#$%&\'*+\/=?^_`{|}~-]+)*@(?:[_\p{L}0-9][-_\p{L}0-9]*\.)*(?:[\p{L}0-9][-\p{L}0-9]{0,62})\.(?:(?:[a-z]{2}\.)?[a-z]{2,})$/ui
and print "All ok\n";
$t =~ /(?:[\p{L}0-9][-\p{L}0-9]{0,62})\./ui
and print "ok A\n";
$t =~ /@(?:[_\p{L}0-9][-_\p{L}0-9]*\.)*/ui
and print "ok B\n";
$t =~ /@(?:[_\p{L}0-9][-_\p{L}0-9]*\.)*(?:[\p{L}0-9][-\p{L}0-9]{0,62})\./ui
and print "ok C\n";
}
test1('test@hoge.page.jp'); # all OK
test1('test@hoge._page.jp'); # NG for 2nd domain
test1('test@_hoge.page.jp'); # all OK (_hogeはホスト名)
test1('test@_hoge._page.jp'); # NG for 2nd domain
test1('test@page.jp'); # all OK
test1('test@_page.jp'); # NG for 2nd domain (_page はホスト名とは扱われない)
実行結果
test@hoge.page.jp
All ok
ok A
ok B
ok C
test@hoge._page.jp
ok A
ok B
ok C
test@_hoge.page.jp
All ok
ok A
ok B
ok C
test@_hoge._page.jp
ok A
ok B
test@page.jp
All ok
ok A
ok B
ok C
test@_page.jp
ok A
ok B
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.11%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
質問への追記・修正、ベストアンサー選択の依頼
m.ts10806
2018/06/02 18:18
?: ←むしろここを1個ずつ解析された方がいいかもしれません。その方面で調べてみてください。
gano
2018/06/05 11:30
事前に調べたのですが, (?: ....) は後方参照不要なグループ化ということでして、その部分は理解できているのかなと考えてます。https://www.rubylife.jp/regexp/backreference/index4.html