質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.35%

  • PHP

    25506questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • JavaScript

    22113questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • HTML

    12598questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • 文字コード

    250questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

  • エスケープ処理

    20questions

    エスケープ処理とは、一連の文字や一文字に対して、一定の規則に従って別の意味を適用する処理過程です。

htmlspecialchars()で使われる定数の意味

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 2
  • VIEW 1,396

aaaaaaaa

score 479

phpには、フォームに入力された悪意あるjavascriptやhtml要素を無毒化してくれるhtmlspecialchars()があります。
特殊な文字の機能を別の文字に置き換えてくれるエスケープを行うさい、引数に指定した値によってエスケープできる文字列が変わります。
ENT_CONBATが、変数展開ができるダブルクォートは、変換しないがシングルクォートは変換する。ENT_QUOTESが両方とも変換し、ENT_NOQUOTESが変換しません。
PHPマニュアルというサイトを拝見するとこの三つ以外にもENT_IGNORE、ENT_SUBSTITUTE、ENT_DISALLOWED、ENT_HTML401、ENT_XML1、ENT_XHTML、ENT_HTML5があります。
ただ読解力が無いのか、提示した八つの定数のうちENT_IGNORE、ENT_SUBSTITUTE、ENT_DISALLOWEDは、マニュアルに書いてあることが全く理解できませんでした。
特に頭を悩ませた単語が、無効な符号単位シーケンス(文字コード?)、指定した文書型(DOCTYPE?)、符号位置です。噛み砕いて説明していただくとどうなりますか。

残りのENT_HTML401、ENT_XML1、ENT_XHTML、ENT_HTML5は、htmlspecialcahrsで受け取った値をENT_のあとに続く文字として扱うと書いてありました。
html5やファイルの書き方の規則の一つであるXMLなどは、理解できますが値をそれらとして扱うというのは、具体的にどういうことなのでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • kei344

    2016/08/03 20:33

    タイトルに「htmlspecialchars()の」を付けられてはいかがでしょう。

    キャンセル

  • aaaaaaaa

    2016/08/05 17:01

    ご返答有難うございます。それは何故でしょうか。

    キャンセル

  • kei344

    2016/08/05 17:11

    質問内容が htmlspecialchars の定数について書かれているからですが、他の定数についても質問に含まれるのでしょうか。

    キャンセル

  • aaaaaaaa

    2016/08/05 18:04

    ご指摘ありがとうございました。題目を編集しました。

    キャンセル

回答 1

+4

Latin-1のような1バイトコードは別として、UTF-8のような複数バイトから生成される文字コードの場合、でたらめに並べたバイト列が正しく文字とならないことがあります。そのような文字が現れた場合、

  • ENT_IGNORE…無効な文字を取り除いてしまう
  • ENT_SUBSTITUTE…U+FFFD(�)に置き換える
  • ENT_DISALLOWED…U+FFFD(�)に置き換える(Unicode領域にあっても不適当な文字まで置き換え)
  • 無指定…失敗して空文字列を返す

Unicodeのコードポイントにあっても、たとえばHTML5には文字として使えない領域があるので、そういうのを弾くか弾かないかがENT_SUBSTITUTEENT_DISALLOWEDの違いです。

アポストロフィ1つに対して、HTML 4.01以外では'が存在するのでそれを使いますが、HTML 4.01ではないので'と数値参照にします。htmlentitiesではもう少し違いが出るかもしれませんが、htmlspecialcharsではこれだけです。

…これを書くために調べていたら、mpywさんがQiitaに投げたものがみごとにヒットしました。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/08/05 18:03

    ご回答有難うございます。
    1バイトから6バイトで表現する文字エンコーディングを利用しているときに、不正なバイトの並びをした文字コードがあると正しく文字として認識されないので、
    認識されない部分を削除するのが「IGNORE」で、16進数で置き換えるのが「SUBSTITUTE」、引数に何も指定しないと空文字を返す、ということですね。

    >>HTML5には文字として使えない領域があるので
    重ね重ね申し訳ありませんがそれは、文字とそれに対応する文字コードがunicodeとして定義されていてもHTML5が使われるページだと表示されない、ということでしょうか。
    つまり、正しくない文字コード、というワケでもないのにHTML5だと何故か表示されないので「DISALLOWED」は、別の文字に置き換えてしまうという認識であっておりますか。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.35%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • PHP

    25506questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • JavaScript

    22113questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • HTML

    12598questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • 文字コード

    250questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

  • エスケープ処理

    20questions

    エスケープ処理とは、一連の文字や一文字に対して、一定の規則に従って別の意味を適用する処理過程です。