テキストファイル1に含まれる単語のうち、テキストファイル2(テキストファイル1と行数が異なり、既にソートされている)に含まれないものの数を求めたいです。
追記:
パイプを用いて1行でする方法はありませんか?
cat テキストファイル1 | tr ' ' '¥n' | sort -f | uniq -i | diff テキストファイル1 テキストファイル2 | wc -l
自分は上のように書いてしまったのですが、これだと行の比較になってしまいますよね?
テキストファイル2はテキストファイル1の単語数よりもかなり多いです
なにか良い方法があれば教えていただきたいです
テキストファイル2がoneだけで、テキストファイル1がtwo one twoの時は二個と答えて欲しいのですか、それとも1個と答えて欲しいのですか。
テキストファイル2 は 1単語/1行で重複なしなのかな?
>テキストファイル2がoneだけで、テキストファイル1がtwo one twoの時は二個と答えて欲しいのですか、それとも1個と答えて欲しいのですか。
これについては
1個と答えて欲しいです。
以下のようなコマンドを実行後って感じです
cat テキストファイル1 | sort | uniq
>テキストファイル2 は 1単語/1行で重複なしなのかな?
これについては
既にsortとuniq(大文字小文字区別しない)ということを行っているため、重複はないです
回答2件
あなたの回答
tips
プレビュー