質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

Q&A

1回答

1093閲覧

patternfileを使ったShift-JISファイルを対象としたGrep検索

cubicroot3

総合スコア0

grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

0グッド

0クリップ

投稿2021/12/16 13:43

実現したいこと

patternfileを使ったShift-JISファイルを対象としたGrep検索

発生している問題

下記のコマンドでGrep検索を実行しました。

grep -f ./patternfile.txt -rn /mydirectory

mydirectory以下には複数のディレクトリ・ファイルが存在していますが、
すべて文字コードがShift-JISです。

一方、patternfile.txtには検索対象としたい文字列が改行で区切って記載されており、
文字コードがUTF-8です。

この状態でGrepを実行すると、patternfile.txt内の日本語がヒットしません。

試したこと

patternfile.txtをShift-JISに変換してコマンドを実行すると、

grep: ./patternfile.txt:1: Unmatched [, [^, [:, [., or [=

とエラーになってしまいました。

https://qiita.com/pman-taichi/items/759981fd18bbfe1a4797
また上記サイトのようにechoで渡した文字列を一度nkfでshift-jisに変換してgrepにわたすことで検索が実現出来ることはわかりました。

しかし今回、patternfileには500種ほど検索対象の文字列があるため、
可能であればファイル読み込みにて検索を実現したいです。
なにか方法はあるでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

grepで直接Shift_JISを使うなら、ロケールを設定する必要があります。

sh

1export LANG=ja_JP.Shift_JIS 2grep -f ./patternfile.txt.sjis -rn /mydirectory

そのgrepがShift_JISに対応していればですが。

投稿2021/12/16 14:18

otn

総合スコア85901

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2021/12/16 14:19

あと、ありがちなのが、Shift_JISと思っていたけど実はMicrosoftの拡張文字が含まれていたというケース。 その場合は、ja_JP.CP932 ですが、これもgrepが対応していればです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問