質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

Q&A

解決済

3回答

6685閲覧

文字列のバイト変換後の比較

ecaepazo

総合スコア25

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

0グッド

0クリップ

投稿2016/01/28 14:12

String型文字列の桁数チェックのため、バイトに変換して比較したいです。

java

1import java.io.BufferedReader; 2import java.io.InputStreamReader; 3 4public class Main { 5 public static void main(String[] args) throws Exception { 6 String str = "あ"; 7 int max = 255; 8 if (str.getBytes().length > (byte)max) { 9 System.out.println("true"); 10 } else { 11 System.out.println("false"); 12 } 13 } 14}

以上のプログラムを実行するとtrueになってしまいます。

str = ”あ” = 2
max = 255
の単純な比較だと思ったのですが、falseになりません。

max = 127 にすると、false
max = 128 にすると、true

ということまではわかりましたが、なぜそうなるのかが理解できません。

getBytes.length が int型と想定し、プログラム自体は下記の方法で解決しているのですが、その現象がどのような理由で起こるのかわからなかったため質問させていただきました。

どなたかご教授ください。
よろしくお願いします。

java

1... 2 int max = 255; 3 if (str.getBytes().length > max) { 4 System.out.println("true"); 5...

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

max = 127 にすると、false
max = 128 にすると、true

Javaはなぜか符号なし整数型が存在しないので、0~255の8bit値を表現するデータ型が存在しません。byte型は符号付き8bit整数値であり、値の範囲は-128~127となります。
128は16進数表現で80ですが、byte型に変換したことで符号付き8bitに置き換わり-128になってしまいます。当然2は-128よりも大きいのでtrueという結果になります。

投稿2016/01/28 14:43

編集2016/01/28 14:46
catsforepaw

総合スコア5938

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ecaepazo

2016/01/28 15:20

ありがとうございます。 なるほど! byte型の範囲が-128〜127であれば、自然なことですね。
guest

0

Javaでbyteは2の補数表現で-128~127の範囲しか表現できないためです。
255は2進数で11111111で、これは8ビットの2の補数では-1を表します。

投稿2016/01/28 14:41

編集2016/01/28 14:42
swordone

総合スコア20651

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ecaepazo

2016/01/28 15:22

ありがとうございます。 2の補数表現について、大学で習ったのを思い出しました。 普通に255までで計算できると思い込んでいました。
swordone

2016/01/28 17:43

ちなみに、byteで扱える最大値、最小値はラッパークラスのByteから、Byte.MAX_VALUE,Byte.MIN_VALUEで取れます。
ecaepazo

2016/01/31 14:33

そのような機能もあるのですね! ありがとうございます
guest

0

ベストアンサー

1 byte が 8ビットの環境では、byte 型は 8ビットの符号付整数として扱われます。
この場合 128~255 までの間は最上位ビットが1の状態ですので、みな負の数となります。
例えば 255 は、8ビット整数のすべてのビットが 1 ですので、整数値としては -1 になります。
従って str.getBytes("あ").length の値
(デフォルトの文字コードが、MS932やEUC-JPの場合 2)よりも、

128~255 を byte 型にキャストしたものは小さな値となります。

文字列をバイト列化するのは一つのやり方ですが、その長さを表現するのにまで byte 型を使う必要はないと思います。
整数型の型による違いは扱える数値の範囲です。
想定される数値(この場合は文字列のバイト長)が十分扱える型を選ぶべきです。
byte は -128~127 までしか扱えませんので、255 という値を保持することはできません。
int か long を選ぶべきでしょう。(一般的な用途では int で足りるでしょう)

カウントしたバイト数の上限チェックだけを行うのであれば、
最後に示されたコードでだいたいあっていると思います。

ただ、

桁数チェック

ということを言われているので、一つ注意点を挙げておきます。

以下のコードを実行すると、

Java

1public class Main { 2 public static void main(String[] args) throws Exception { 3 String[] encodes ={ 4 "utf-8" 5 ,"utf-16" 6 ,"MS932" 7 ,"EUC-JP" 8 }; 9 10 String str = "ABあア"; 11 12 for (String encode : encodes) { 13 System.out.printf("[%s:%d]\n", encode, str.getBytes(encode).length); 14 } 15 } 16}

以下のように出力されます。

[utf-8:8] [utf-16:10] [MS932:5] [EUC-JP:6]

str.getBytes().length はデフォルトのエンコードでこの処理をやっているので、
環境変数などでデフォルト文字コードが変われば、バイト数は変わってきます。

画面上の桁幅を求めるなどの目的であれば、
描画ライブラリのフォントと文字列を指定することで、
ピクセル数を求めるようなメソッドを利用されたほうが確実だと思います。

投稿2016/01/28 14:40

編集2016/01/28 17:09
kozuchi

総合スコア1193

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ecaepazo

2016/01/28 15:28

詳しく説明して頂きありがとうございます。 大学で学んでいたはずなのに完全に抜けていました。 文字列をバイト単位で比較する場合は、解決したと思われるコードで正しいのでしょうか?
kozuchi

2016/01/28 17:14

すいません、記述に間違いがありました、 >(Javaの場合は内部文字表現が UTF-8なので 2) これは嘘です。 (デフォルトの文字コードが、MS932やEUC-JPの場合 2) というのが正解です。 回答の内容を訂正しました。 >文字列をバイト単位で比較する場合は、解決したと思われるコードで正しいのでしょうか? このお話に関しては、上の訂正と合わせ本文に 回答を書きましたのでご面倒ですが、後半の追加部分を見てください。
ecaepazo

2016/01/29 03:48

文字コードでもだいぶ変わるのですね。 今回はシステム上MS932固定だった気がします。 エンコードが変わる場合はここに応じた処理が必要なのですね。 ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問