質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.34%

Bashでファイルをある条件で抽出したい

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 2,157

mamesiba

score 19

実現したいこと

Bashでファイルの更新日時から月と日付を見て、ファイルのパスまたはファイル名を抽出したい。

具体的な条件は
5日前のファイルかつ、各月の一番降順のものを一つだけを除き抽出したいです。

例 
現在:68日の時

5275285316165日 ←5日前ではないので条件に入らず
だったら527日と528日と61日を抽出

のような結果がほしいです。
何かいいアドバイスなど頂けないでしょうか?

何やりたいのか

cronで定期的に一個のダンプファイル生成と

同時にを更新日時を見て、必ず1ヶ月 
一個はダンプファイルを残すようにして削除したい
←出来ないのはこの部分

イメージ1

#!/bash/bash

find [path]*.gz -mtime +5 -name "*.gz"  and 5日前のファイルかつ、各月の一番降順のものを一つだけを除いた条件 
| xargs rm -f

exit 0

イメージ2

#!/bash/bash

find [path]*.gz -mtime +5  -name "*.gz"  | while IFS= read do
ここに処理
done

exit 0
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • otn

    2016/06/09 00:18

    日本語と、書きかけのスクリプトが一致せず、何やりたいのか、わかりません。
    あと、「更新日」「更新月」とは何のことですか?
    つまり、日本語での説明が全然足りていません。

    キャンセル

  • mamesiba

    2016/06/09 00:42 編集

    不足でした。申し訳ありません。説明不足がありましたら追記します

    キャンセル

回答 1

checkベストアンサー

+1

5日前のファイルかつ、各月の一番降順のものを一つだけを除き抽出したいです。 

「4日以内のファイルは残す。それを除いた各月の最新のファイルは残す。それ以外は消す」ということですよね。

LAST=
find [path]*.gz -mtime +5  -name "*.gz" |
while read FILE
do YM=$(date +%Y%m -r "$FILE")
   if test "$LAST" = "$YM"
   then rm "$FILE"
   fi
   LAST="$YM"
done

追記:

↑これでは駄目ですね。findの結果は更新日時順にソートされている訳じゃない。
毎日1ファイル作られているなら、新しい順にソートして、先頭4行をカットすればいいので、

ls -1t *gz | sed 1,4d |
while read FILE
・・・


最初、↑で考えていたのですが、「毎日1ファイル作られているとは限らないな」と思い、投稿の直前に、質問文のfindの行をコピペで書き換えてしまいました。
毎日1ファイル作られているとは限らない場合で、同じ条件だと、面倒そうです。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/06/09 23:26 編集

    動作確認時、質問者がソートの条件忘れてました💦

    Cronは毎日ではないです。
    パイプでいけそうな気はするのですが
    難しいですね。

    ソースを参考に頑張ってみます。

    キャンセル

  • 2016/06/09 23:38

    「現時点での最新の4ファイルと、それを除いた各月の最新1ファイルを残す」でいいのであれば、追記に書いたもので良いと思います。

    キャンセル

  • 2016/06/10 00:00

    ありがとうございます。

    でも、もう少し頑張ります…

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る