2020年Javaでサロゲートペアを取り扱うベストな方法を教えていただきたいです。
Javaの内部処理で扱われる文字コードはUTF-16であり、
一部文字においてサロゲートペア問題が発生します。
Java14までリリースされている現在(2020/6)でもサロゲートペアの含まれる文字列を
効率的に扱う方法は確立されていないのでしょうか。
何をもって「効率的」と呼ぶのでしょうか?
現在のStringメソッドなどにもサロゲートペアを扱うメソッドがいくつかあるはずですが?
自分の視野の範囲内に押さえたくなかったので、あえてぼかさせていただきました。
一例を挙げるとすれば、Java8では、サロゲートペアを含む文字列で何文字目かを確実に取得するメソッド(charAtに値するもの)は用意されていないと思ってます。
googleのguavaにある!とかJava14ではメソッドが増えてるなどの情報を聞いてみたかったのです。
Java14ではメソッドが増えてるなど
ドキュメントを確認して下さい。
マジレスすると、マルチバイト文字列は国産のもの以外は扱いが低いです。
回答1件
あなたの回答
tips
プレビュー