質問編集履歴

3

タイトルが間違っていたのを修正

2018/08/29 06:12

投稿

stmkza
stmkza

スコア478

test CHANGED
@@ -1 +1 @@
1
- PHPでUnicodeの結合文字を正規化する方法
1
+ PHPでUnicodeの結合文字を判定する方法
test CHANGED
File without changes

2

絵文字に関して追記

2018/08/29 06:12

投稿

stmkza
stmkza

スコア478

test CHANGED
File without changes
test CHANGED
@@ -11,3 +11,7 @@
11
11
 
12
12
 
13
13
  文字コードはUTF-8を使用しています。
14
+
15
+
16
+
17
+ 絵文字などは許容して、日本語以外のこのような複数バイトで構成される文字を弾きたいです。

1

結合文字だということを知ったので編集

2018/08/29 05:55

投稿

stmkza
stmkza

スコア478

test CHANGED
@@ -1 +1 @@
1
- PHPでUnicodeの特殊文字を弾く方法
1
+ PHPでUnicodeの結合文字を正規化する方法
test CHANGED
@@ -1,13 +1,13 @@
1
- PHPでWebアプリケーションを作っているのですが、ユーザが名前などとして設定した文字列にUnicodeの特殊文字で、他の文字と組みわせて表示が変化する文字(アラビア文字?などで使われるような文字)などが入力されること表示崩れなどを起こすことを心配してす。
1
+ PHPでWebアプリケーションを作っているのですが、ユーザが名前などとして設定した文字列にUnicodeの合文字が入力されることによる表示崩れなどのいたずら防ぎたす。
2
2
 
3
3
 
4
4
 
5
- PHPを使っ普通記号ギリシャ文字は弾かずに、文字サズが通常なる文字(アラビア文字など)を弾く方法はありませんか?
5
+ 調べみたら、これが異体字セレクタや、macOSファイルシステムで濁点半濁点がついた文字が複数バトで表現されてしまう時同じよう仕様を使っていようです。
6
6
 
7
7
 
8
8
 
9
- また、Unicodeには表示を制御する文字(ゼロ幅スペースやNon-Breaking Spaceなど)も含まれているので、それも弾きたいです。
9
+ 日本語などでこのような風に使われている場合は許容して、それ以外の言語用ののが使われている場合は弾きたいですが、PHPを使って実装する方法を教えていただきたいです
10
10
 
11
11
 
12
12
 
13
- 文字コードはUTF-8を使用しています
13
+ 文字コードはUTF-8を使用しています