質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
csh

cshは、C言語スタイルの構文を持つUNIX系OSのシェルの1つのことです。

Q&A

1回答

3489閲覧

cshでファイル(sjis)を読み込み、正規表現で文字化けを変換したい

saitama

総合スコア7

csh

cshは、C言語スタイルの構文を持つUNIX系OSのシェルの1つのことです。

0グッド

0クリップ

投稿2017/09/14 06:44

###前提・実現したいこと
お世話になります。
cshで以下のようなバッチを作成したいと考えております。
datファイル(sjis)を読み込み、文字化けをしていたら適当な文字に変更するといったものです。
例)
亜(文字コード 0xff 0xff 0x889f)

●●亜(文字コード 0x819c 0x819c 0x889f)

また、同時に特定列のみ変換対象としたいのですがどうしたらよいでしょうか?
例)
111,aaaa,あああ,****
222,iiii,いいい,++++
333,uuuu,亜,----

の場合だったら3列目のみ変換対象とし、他の列は変換対象外としたいです。

###該当のソースコード

csh

1perl -pi -e 's/[^\x88\x9F-\xEA\xA4\xFA\x40-\xFC\x4B\x01-\x7E\xA1-\xDF\x81\x40-\x84\xBE]/●/g' aaaaa.dat

###試したこと
\x88\x9F-\xEA\xA4 第一水準 第二水準
\xFA\x40-\xFC\x4B IBM拡張文字
\x01-\x7E 半角ローマ字等
\xA1-\xDF 半角カナ等
\x81\x40-\x84\xBE 全角記号
上記ソースの正規表現で
一応変換はできたのですが、この正規表現は正しいのでしょうか?

また、特定列のみ対象とすることに関しては、

perl -F, -lane 'print "$F[3]\n"' aaaaa.dat > iiiii.dat や
cat aaaaa.dat | cut -b9-14 > iiiii.dat で
列の抽出をすることまではできたのですが、変換対象にするのかまではわかりませんでした。
(ワンライナーとしてperlコマンドを使用しました)

###補足情報(言語/FW/ツール等のバージョンなど)
OS:SunOS 5.10
cshでのみ作成可能

以上です。宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

とりあえず、こうした処理をワンライナーでやろうというのは無理すぎますので、
perlスクリプトを書いてください。サンプルは前回の質問でご紹介しました。

投稿2017/09/14 07:27

KojiDoi

総合スコア13669

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

saitama

2017/09/14 07:46

cshで作成しなくてはいけないため、このような質問をさせていただきました。 ご回答ありがとうございます。
KojiDoi

2017/09/14 08:00

でもperlは使えるんでしょう? まさか一切外部コマンド無しで処理するつもりですか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問