以下の項目のみを許容する正規表現はどのように実現したらよいでしょうか?、
・半角(半角カナ含む)
・全角カナ
・全角記号
javascript
1/[ぁ-ん一-龠]/
上記の記述だけでははじけない漢字もあるようなので...
/(?:[々〇〻\u3400-\u9FFF\uF900-\uFAFF]|[\uD840-\uD87F][\uDC00-\uDFFF])/
http://tama-san.com/kanji-regex/より上記のような制限の掛け方を見つけて使ってみた所、ある程度実現したいことが出来ているのかなという感じだったのですが(ろくに正規表現の記述を読めないだけですが)、上記の正規表現がどういうことをやっているのかが分からないので教えてくださると嬉しいです。
(?:)などはどういった意味を持つ記述なのかがわかりません。
逆に言うと ASCII 文字以外は「はじく」ということでいいのですか。だとして、「はじく」というのは具体的にどういうことを言ってますか?
文字列にひらがなと漢字は入ることを許さないということです。それ以外の全角文字はもちろん英数字記号等は許容したいのです。
あなたの言う「ひらがな」と「漢字」って何ですか?
どういう意図の質問でしょうか
こっちが聞きたいです。IME パッドが使えるならそれを開いて Unicode にはどういう文字があるか見てください。そしてそれらの内、あなたの言う「ひらがな」と「漢字」がどれに該当するかを考えれば私の言ってることが分かると思います。
たとえばアラビア文字とか、麻雀パイとか、顔とか、統合カナダ先住民音節とか、上付き文字とか、点字とか、それらを通してなぜ漢字とひらがなだけ? ということです。あと、繁体字や簡体字は漢字ですがどうしますか?
全角については全角カタカナと記号以外をはじきたかったのでひらがなと漢字は許さないとしただけです。ほかにも考慮する全角文字があったのは知りませんでした。失礼しました。
質問を変更する時には慎重にお願いします。特に、すでに回答をいただいている場合は整合がとれなくなりますので、追記するか別質問を立てる方がいいかと思います。
回答2件
あなたの回答
tips
プレビュー