質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

2回答

9220閲覧

HTML、UTF-8の不要な実体参照。

makoto-n

総合スコア436

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

3クリップ

投稿2015/09/23 03:39

UTF-8(ボムなし)の特殊文字で実体参照を用いる必要のない文字__[—(—)、”(”)]__を教えてください。
一覧やリスト化しているURLを教えてくれると助かります。

実体参照という言葉をつい先日知ったばかりで使い方がおかしいかもしれないです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

必要不要と言うことで分けると、HTMLで実体参照を使うのが必要な物は、< > & " ' の5文字だけだと思います。それ以外は不要のはず。
のように目で見て単なる空白と区別が付かない場合なども実体参照を使った方が良いと思います。

「開発環境がすべてUTF-8で統一されていて、すべてのユニコード文字をキーボードから入力できるし、目で見て区別できる」という環境で無い場合は、開発環境で扱えない/入力できない文字は実体参照で入力することになるかと思います。

投稿2015/09/23 04:10

otn

総合スコア84710

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

makoto-n

2015/09/23 14:22

©コピーライト 開発環境で変換出来たらそれでよいということですか?
otn

2015/09/23 15:29

そうですね。自分たちに不都合なければそのままでいいのでは。ブラウザで見るユーザーからは同じに見えますので。 回答を書いたときは開発環境しか思い浮かびませんでしたが、障害対応で直接データを見ることも考えると本番環境障害対応環境等も考慮した方が良いかもしれません。 ただ、このあたりは個別の環境での実用面の利便性の話なので、質問への回答としては、前記の5文字だけです。 あとは、ユニバーサルデザインの観点かと思いますが、軽くググった範囲では実体参照に言及している例は見当たらなかったです。まあ、これも質問の範囲を超えているかと思います。
guest

0

ベストアンサー

恐らく質問者は文字実体参照の一覧を知りたいという事ではないでしょうか。
文字参照には、Unicodeの文字番号で表現する数値文字参照(&#9834;&#x266A;など)と、特定のキーワードで表現する文字実体参照(&lt;&nbsp;など)の2種類が存在します。

文字実体参照の一覧を探した所、見つかったのはこちらになります。
(重いページです。開く際は注意して下さい)

8 The HTML syntax — HTML5

W3Cの仕様ページにあるので、恐らく間違いないと思います。
この表には、例えば「&lt;」の場合は「LT;」と記述された行があり、その横に対応する文字のUnicode表記(U+0003C)と文字そのもの(<)が記述されています。

ただ、このページに記載されている文字実体参照の一覧はHTML5のものです。よって古いPCや携帯端末などでは利用できない可能性があります。

投稿2015/09/23 14:02

sounisi5011

総合スコア697

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

makoto-n

2015/09/23 14:27

> 文字参照には、Unicodeの文字番号で表現する数値文字参照(&#9834;、&#x266A;など)と、特定のキーワードで表現する文字実体参照(&lt;、&nbsp;など)の2種類が存在します。 実態参照ってそのことだったんですね! 一覧、文字参照(&copy;)をしなくてもhtmlに記号を書けば表示されるもののリストが欲しい、ということです。
sounisi5011

2015/09/23 23:29 編集

ある文字をHTML内に直接書くことが可能かどうかは、まずHTMLの文字コードに依存すると思います。 例えばShift JISのHTMLには、Unicodeの絵文字は直接は書けません(Shift JISに存在しないため)。 Shift JISのHTMLでUnicodeの絵文字を表現したい場合は、文字参照を利用することになります。 HTML5の仕様では、HTML内には文字参照と以下の条件全てに当てはまらない文字が含められるそうです。 * U+0000 * Unicodeで未定義の文字 * スペースを除く制御文字 ※スペースとは、次の文字のことです。スペースはHTMLに含めることができます: U+0020, U+0009, U+000A, U+000C, U+000D ※Unicodeにおける制御文字の一覧はこちらになります。範囲はU+0000~U+001F, U+007F, U+0080~U+009Fです: http://www.fileformat.info/info/unicode/category/Cc/list.htm 上記に挙げた含められない文字は、たとえ文字参照でもHTML内に含めることを禁止されているようです(公式バリデーターで確認。制御文字U+0080に対応する文字参照"&#x0080;"がエラーとなりました)。 また、基本的には"<"も直接は含められないようです。"&lt;"とした方が良いでしょう。 (title要素やscript要素など、含めることが可能な例外が存在します) 参考: http://www.w3.org/TR/html-markup/syntax.html#normal-character-data http://www.w3.org/TR/html-markup/syntax.html#syntax-text http://www.w3.org/TR/html-markup/terminology.html#space https://en.wikipedia.org/wiki/Unicode_control_characters https://validator.w3.org/
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問