現在、macのターミナル上でmecabに | cut -f 1 | sort | uniq -c | sort -r -n コマンドを使って1ファイル1行のテキストファイルの単語数をカウントをしています。1000ファイル結合した1000行のテキストファイルなら問題なくカウント出来ました。
しかし、10000行のような膨大な数で実行すると、argument list too long というエラーが起きてしまいます。
多くのテキストデータのカウントできるようにする良い方法は何か無いでしょうか?
ご教授お願い致します。
ターミナルのコマンドに関しては以下のURLのサイトを参考にしました。
http://ldl.ic.kanagawa-it.ac.jp/ioroi/programer/wordcount/wordcount.html
回答3件
あなたの回答
tips
プレビュー