前提・実現したいこと
2つのcsvファイルを比較して、キー(前方複数項目の組み合わせ)の追加削除の差分なのか、キー以外の変更なのか、判定したい
キー部分のみ抽出したファイルのdiff結果(10万行程)をとり、
追加削除の差分行を、比較するcsvファイルから行削除★し、キー追加削除の差分が生じないファイルをつくり、それらのdiffとり、最後にキー部分のみのdiff結果をマージすることで実現しようと考えました
★の部分は、追加差分と削除差分で行削除するcsvファイルを入れ換えてます。★での下記処理が遅く20分程かかってしまいます。高速化する手立てがあれば教えてください
該当のソースコード
bash
1cat del_key.csv | xargs IXXX sed -ie "/^XXX/d" hikakumoto.csv 2