質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PowerShell

Windows PowerShellはコマンドラインインターフェースであり、システム管理を含むWindowsタスク自動化のためのスクリプト言語です。

Q&A

解決済

4回答

10358閲覧

Power shellでマルチバイト文字かどうかの判定を行う方法について

zidane582003

総合スコア8

PowerShell

Windows PowerShellはコマンドラインインターフェースであり、システム管理を含むWindowsタスク自動化のためのスクリプト言語です。

0グッド

0クリップ

投稿2016/12/15 08:11

###前提・実現したいこと

Power shellのスクリプトで、ある文字列の50バイト目を マルチバイト文字かシングルバイト文字か判定する方法を知りたく質問いたしました。

###該当のソースコード

function get-substringbytes([String]$Text,[int]$StartIndex=0,[int]$Length=0){ $enc=[System.Text.Encoding]::Default $bytes=$enc.GetBytes($Text) return $enc.GetString($bytes,$StartIndex,$Length) }

###発生している問題・エラーメッセージ

上記の「該当のソースコード」の欄に記載したfunctionを使用して、引数に渡した文字列を50バイトずつ切り出すという処理を行っているのですが、 50バイト目のところに、マルチバイト文字が入ってしまうと当然ながら、正常に文字を切り出すことができませんでした。 --------------------------------------------------------------------------- 実行例) > get-substringbytes "あいうえおかきくけこさしすせそたちつてとなにぬねxの" 0 50 あいうえおかきくけこさしすせそたちつてとなにぬねx・ --------------------------------------------------------------------------- そこで50バイト目の文字がマルチバイト文字の時だけ、49バイト目まで取得するように変更しようかと考えたのですが、 Power shellで"50バイト目の文字がマルチバイト文字かどうか"の判定を行えるのかわからず質問させていただきました。

###補足情報(言語/FW/ツール等のバージョンなど)

Powershellバージョン ------------------------------- > $PSVersionTable.psversion Major Minor Build Revision ----- ----- ----- -------- 2 0 -1 -1 -------------------------------

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2016/12/15 08:16

MSDN フォーラムにも同じ質問をしていませんか?
guest

回答4

0

マルチポストなのか、同様な質問を別の人が別のサイトに書いているのか分かりませんが、その別のサイトの URL を貼っておきます。

https://social.msdn.microsoft.com/Forums/ja-JP/57775d6a-9a9f-4e58-8e4d-d772b84aefdb?forum=powershellja

投稿2016/12/15 15:56

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

判定したい文字列の文字コードが確定しませんが、Windows環境だということと、1文字あたりのバイト数を踏まえてシフトJISだということを前提に回答します。

厄介なことに、シフトJISの場合、以下のようなコード配置となっているので、そのバイト位置だけ見ても文字の区切りが決まりません。最悪「1文字目から順に見ていく」しか手段がないケースもあります。

  • 1バイト文字(ASCII)…0x00-0x7f
  • 1バイト文字(半角カナ)…0xa0-0xdf
  • 2バイト文字の1バイト目…0x81-0x9f、 0xe0-0xfc
  • 2バイト文字の2バイト目…0x40-0xfc(0x7fを除く)

投稿2016/12/15 08:19

maisumakun

総合スコア145183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

自己解決

ご回答いただきありがとうございます。

50番目と51番目で要素でbyte配列を作って文字列に変換を試してみたいと思います。

投稿2016/12/22 07:12

zidane582003

総合スコア8

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

shift_jisかつ2バイト文字までしか扱わないという前提ですが、
50番目と51番目で要素2のbyte配列を作って文字列に変換します。
これで文字数が1なら今回の問題のケースに当てはまるので、49番目までを使うようにします。

実際にやったことがない上にちょろっと考えた程度なのでいろいろ問題があるかもしれませんが。

投稿2016/12/15 08:42

ishi9

総合スコア1294

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問