質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Perl

Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

Q&A

解決済

1回答

7381閲覧

【Perl】UTF-8フラグについて

BANDIT1250FABS

総合スコア86

Perl

Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

0グッド

0クリップ

投稿2015/06/30 02:05

PerlにおけるUTF-8フラグってなんですか?
また文字列にUTF-8フラグが立っているかどうかを確認する方法はありますか?
UTF-8フラグが立っている文字列をprintで出力すると
Apacheのエラーログに
Wide character in printというエラーが出力されます。
調査の結果UTF-8フラグが立っている文字列を主力すると出る警告メッセージみたいです。
どのタイミングで文字列にUTF-8フラグが立ってしまったのか確認したいと思っております。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

UTF-8フラグとはPerl内部文字コードで、Perlの中で「これは文字列ですよ〜」というフラグです。
Perlは内部で取り扱うデータはすべてバイナリデータとして取り扱ってます(たぶん

lang

1# sample_1 2use utf8; 3print length("あいうえお");

lang

1# sample_2 2print length("あいうえお");

次のような2つの場合、sample_1の方は「use utf8;」とソース内の文字列すべてにUTF8フラグを付ける宣言をしています。
この場合、lengthで出力される数字は文字数の5が出力されます。
sample_2の方は、UTF8フラグがなくバイナリとして数えられ「15」と表示されます。(1文字3バイト構成)

またバイナリとして文字列を操作する場合、特定の文字と文字が続くと別の意味の文字になる事があり、
文字化けの原因や、正規表現などでの誤動作を起こす事があるようです。
なので、Perlで文字列を操作する時はUTF-8フラグを付けるようにした方がいいです。

UTF-8フラグが付いている文字列かどうかのチェックは、Encodeパッケージのis_utf8で調べる事ができます。

lang

1use Encode; 2if (Encode::is_utf8("てすとてすと")) { 3 print "フラグがついている!"; 4}

投稿2015/06/30 10:58

circus55

総合スコア66

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問