質問編集履歴
3
タイトルが間違っていたのを修正
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
PHPでUnicodeの結合文字を
|
1
|
+
PHPでUnicodeの結合文字を判定する方法
|
body
CHANGED
File without changes
|
2
絵文字に関して追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -4,4 +4,6 @@
|
|
4
4
|
|
5
5
|
日本語などでこのような風に使われている場合は許容して、それ以外の言語用のものが使われている場合は弾きたいのですが、PHPを使って実装する方法を教えていただきたいです。
|
6
6
|
|
7
|
-
文字コードはUTF-8を使用しています。
|
7
|
+
文字コードはUTF-8を使用しています。
|
8
|
+
|
9
|
+
絵文字などは許容して、日本語以外のこのような複数バイトで構成される文字を弾きたいです。
|
1
結合文字だということを知ったので編集
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
PHPでUnicodeの
|
1
|
+
PHPでUnicodeの結合文字を正規化する方法
|
body
CHANGED
@@ -1,7 +1,7 @@
|
|
1
|
-
PHPでWebアプリケーションを作っているのですが、ユーザが名前などとして設定した文字列にUnicodeの
|
1
|
+
PHPでWebアプリケーションを作っているのですが、ユーザが名前などとして設定した文字列にUnicodeの結合文字が入力されることによる表示崩れなどのいたずらを防ぎたいです。
|
2
2
|
|
3
|
-
|
3
|
+
調べてみたら、これが異体字セレクタや、macOSのファイルシステムで濁点や半濁点がついた文字が複数バイトで表現されてしまう時と同じような仕様を使っているようです。
|
4
4
|
|
5
|
-
|
5
|
+
日本語などでこのような風に使われている場合は許容して、それ以外の言語用のものが使われている場合は弾きたいのですが、PHPを使って実装する方法を教えていただきたいです。
|
6
6
|
|
7
|
-
文字コードはUTF-8を使用しています
|
7
|
+
文字コードはUTF-8を使用しています。
|