質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

エスケープ処理

エスケープ処理とは、一連の文字や一文字に対して、一定の規則に従って別の意味を適用する処理過程です。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

1回答

2930閲覧

htmlspecialchars()で使われる定数の意味

aaaaaaaa

総合スコア501

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

エスケープ処理

エスケープ処理とは、一連の文字や一文字に対して、一定の規則に従って別の意味を適用する処理過程です。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

1グッド

2クリップ

投稿2016/08/03 11:19

編集2022/01/12 10:55

phpには、フォームに入力された悪意あるjavascriptやhtml要素を無毒化してくれるhtmlspecialchars()があります。
特殊な文字の機能を別の文字に置き換えてくれるエスケープを行うさい、引数に指定した値によってエスケープできる文字列が変わります。
ENT_CONBATが、変数展開ができるダブルクォートは、変換しないがシングルクォートは変換する。ENT_QUOTESが両方とも変換し、ENT_NOQUOTESが変換しません。
PHPマニュアルというサイトを拝見するとこの三つ以外にもENT_IGNORE、ENT_SUBSTITUTE、ENT_DISALLOWED、ENT_HTML401、ENT_XML1、ENT_XHTML、ENT_HTML5があります。
ただ読解力が無いのか、提示した八つの定数のうちENT_IGNORE、ENT_SUBSTITUTE、ENT_DISALLOWEDは、マニュアルに書いてあることが全く理解できませんでした。
特に頭を悩ませた単語が、無効な符号単位シーケンス(文字コード?)、指定した文書型(DOCTYPE?)、符号位置です。噛み砕いて説明していただくとどうなりますか。

残りのENT_HTML401、ENT_XML1、ENT_XHTML、ENT_HTML5は、htmlspecialcahrsで受け取った値をENT_のあとに続く文字として扱うと書いてありました。
html5やファイルの書き方の規則の一つであるXMLなどは、理解できますが値をそれらとして扱うというのは、具体的にどういうことなのでしょうか。

mpyw👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kei344

2016/08/03 11:33

タイトルに「htmlspecialchars()の」を付けられてはいかがでしょう。
aaaaaaaa

2016/08/05 08:01

ご返答有難うございます。それは何故でしょうか。
kei344

2016/08/05 08:11

質問内容が htmlspecialchars の定数について書かれているからですが、他の定数についても質問に含まれるのでしょうか。
aaaaaaaa

2016/08/05 09:04

ご指摘ありがとうございました。題目を編集しました。
guest

回答1

0

Latin-1のような1バイトコードは別として、UTF-8のような複数バイトから生成される文字コードの場合、でたらめに並べたバイト列が正しく文字とならないことがあります。そのような文字が現れた場合、

  • ENT_IGNORE…無効な文字を取り除いてしまう
  • ENT_SUBSTITUTE…U+FFFD(�)に置き換える
  • ENT_DISALLOWED…U+FFFD(�)に置き換える(Unicode領域にあっても不適当な文字まで置き換え)
  • 無指定…失敗して空文字列を返す

Unicodeのコードポイントにあっても、たとえばHTML5には文字として使えない領域があるので、そういうのを弾くか弾かないかがENT_SUBSTITUTEENT_DISALLOWEDの違いです。

アポストロフィ1つに対して、HTML 4.01以外では'が存在するのでそれを使いますが、HTML 4.01ではないので'と数値参照にします。htmlentitiesではもう少し違いが出るかもしれませんが、htmlspecialcharsではこれだけです。

…これを書くために調べていたら、mpywさんがQiitaに投げたものがみごとにヒットしました。

投稿2016/08/03 11:50

編集2016/08/03 11:55
maisumakun

総合スコア145123

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aaaaaaaa

2016/08/05 09:03

ご回答有難うございます。 1バイトから6バイトで表現する文字エンコーディングを利用しているときに、不正なバイトの並びをした文字コードがあると正しく文字として認識されないので、 認識されない部分を削除するのが「IGNORE」で、16進数で置き換えるのが「SUBSTITUTE」、引数に何も指定しないと空文字を返す、ということですね。 >>HTML5には文字として使えない領域があるので 重ね重ね申し訳ありませんがそれは、文字とそれに対応する文字コードがunicodeとして定義されていてもHTML5が使われるページだと表示されない、ということでしょうか。 つまり、正しくない文字コード、というワケでもないのにHTML5だと何故か表示されないので「DISALLOWED」は、別の文字に置き換えてしまうという認識であっておりますか。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問