grepでエラーするファイル名をリストアップしつつ、ファイル内を文字列検索をしたいです。
解決済
回答 4
投稿
- 評価
- クリップ 0
- VIEW 5,924
最近Linuxを使い始め、ごく簡単なシェルを書いています。
どうしても躓いてしまった事があり、相談させていただきます。
問題は、grepのエラーでシェルが止まってしまう事です。
■シェルの目的■
grepであるディレクトリの中にある大量のファイルから
特定のキーワード(複数)を含むファイルを抽出する事
■目的以外にやりたいこと■
エラーや文字化けの原因となる
「スペース」や「全角文字」を含むファイル名とディレクトリ名
(以下:化けファイルと呼びます)は除外し、
尚且つそのファイル名をリストアップしながら検索を行いたい
※日本語名や半角スペースで命名されたファイル及び
ディレクトリが複数存在する
【経緯】
最初:目的だけ満たすシェルを作った
⇒実際のディレクトリに適用したら止まった
⇒原因を調べたら化けファイルが複数見つかる
⇒ファイル名を“”で囲んで検索することでエラー回避
⇒やっぱり化けファイルは今後使いたくないからリストアップすべきだ!
⇒化けファイル出そうとしたら途中で“処理止まる” ←★いまここ
=========================================
#!/bin/sh
TARGET=$1(検索対象ディレクトリ)
TMP=xxxx.log (findをwhile readするための一時ファイル)
ERRORFILE=xxxx_error.list(化けファイルを控えておくログ)
{中略}
find "${TARGET}" -type f > ${TMP}
cat "${TMP}" | while read filepath
do
GREPERROR=
grep "${TARGET}" ${filepath}
if [ $? -eq 2 ]; then
echo "error grep,${filepath}" >> "${ERRORFILE}"
continue
fi
{キーワード抽出部分は中略}
done < $TMP
===========================================
grepできなかったファイル=化けファイルだったため、
GREPERRORの処理でgrepの戻りが2ならその回は抜ける
と書きたかったのですが…。
この状態で動かすと${TMP}リスト中で化けファイルが出てきたファイルより
下にあるファイルにwhile readが続いていきません。
ちなみに
GREPERROR=
grep "${TARGET}" ${filepath}
GREPERROR=
grep "${TARGET}" "${filepath}"
にするとそのまま動作して処理を終了しますが、化けファイルをふるいにかけることができません。
そもそもgrepだけでなんとかしようとすることに無理があるのかもしれません。
勉強不足であることこの上ないのですが、
どなたかお知恵をお貸し頂けませんでしょうか。
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
+3
find
で抽出するにしても、
find -type f 条件 -print0 | xargs -0 grep 検索文字列
のように書けば、スペースだろうが制御文字があろうがファイル名として取ってくれるようになります。投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
+3
$ ls -l
合計 8
-rw-rw-r-- 1 hoge fuga 16 7月 10 11:33 hoge fuga
-rw-rw-r-- 1 hoge fuga 11 7月 10 11:33 全角
$ grep hoge *
hoge fuga:hogefuga
全角:全角hoge
問題点は、
cat "${TMP}" | while read filepath
do
この部分で、findで見つけてきたファイル名(${TMP})にスペースが入っていると、そこで文字列が分割されてしまうことです。
当初の目的だけを達成するためにはこういう手段もあります。
$ find . -type f -exec grep pattern {} /dev/null \;
スペース、全角が使われているファイル名、ディレクトリ名を検索するにはこれもfindの -regexとか-nameとかでできそうです。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
check解決した方法
0
ターミナル上ではgrepの動作は確認できるのですが、
シェルを通すと化けてしまうようです。bashの設定等でしょうか。
空白の件は単純にあらかじめ空白を含むファイル名を除外しておくことで解決できました。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
0
を読むと、オプションを指定することで、希望する動作をさせる方法を見つけられるかもしれません。
オプションの工夫ではどうにもならなかったら、他のコマンドと組み合わせたり、プログラムを書いたりして対処すると良いと思います。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.10%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
2015/07/10 15:35
ありがとうございます!